KR20210083080A - Method for screening synergistic chemo-therapeutic interaction predicting pair of genes for anticancer agents - Google Patents

Method for screening synergistic chemo-therapeutic interaction predicting pair of genes for anticancer agents Download PDF

Info

Publication number
KR20210083080A
KR20210083080A KR1020190175697A KR20190175697A KR20210083080A KR 20210083080 A KR20210083080 A KR 20210083080A KR 1020190175697 A KR1020190175697 A KR 1020190175697A KR 20190175697 A KR20190175697 A KR 20190175697A KR 20210083080 A KR20210083080 A KR 20210083080A
Authority
KR
South Korea
Prior art keywords
gene
genotype
genes
cells
pair
Prior art date
Application number
KR1020190175697A
Other languages
Korean (ko)
Inventor
이계화
김이준
Original Assignee
서울대학교병원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교병원 filed Critical 서울대학교병원
Priority to KR1020190175697A priority Critical patent/KR20210083080A/en
Publication of KR20210083080A publication Critical patent/KR20210083080A/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Abstract

The present invention relates to a method for screening a pair of synergistic chemo-therapeutic interaction (SCI) genes for an anticancer agent, which can screen a pair of SCI genes quickly and simply, by comparing the reactivity of a pair of mutant genes to an anticancer agent and the reactivity of a pair of genes including at least one wild-type gene to the anticancer agent. The method includes: a first step of screening a gene with mutation in a predetermined number or more of cells among a plurality of cancer cells; a second step of pairing the screened genes by two, and dividing the cells by genotype of each pair of genes, wherein the genotypes are WW, WM, MW, and MM (W is wild-type and M is a mutant gene); a third step of screening a pair of genes in which the anticancer agent reactivity of an MM genotype cell is greater than the anticancer agent reactivity of the other three genotype cells; and a fourth step of screening a pair of genes of which the average value of the anticancer agent reactivity of an MM genotype cell group among the four genotype cell groups is greatest among the four genotype cell groups.

Description

상호 협력적 암 치료제 반응 예측 유전자 쌍을 선별하는 방법{METHOD FOR SCREENING SYNERGISTIC CHEMO-THERAPEUTIC INTERACTION PREDICTING PAIR OF GENES FOR ANTICANCER AGENTS}Method for screening a gene pair for predicting a response to a cancer treatment in cooperation {METHOD FOR SCREENING SYNERGISTIC CHEMO-THERAPEUTIC INTERACTION PREDICTING PAIR OF GENES FOR ANTICANCER AGENTS}

본 발명은 상호 협력적 암 치료제 반응(synergistic chemo-therapeutic interaction, SCI) 예측 유전자 쌍을 선별하는 방법에 관한 것이다.The present invention relates to a method for selecting a synergistic chemo-therapeutic interaction (SCI) predictive gene pair.

암은 세계적으로 75세 이상 전체 사망률의 10%를 차지하는 주요 사망원인 질환으로 유전체 구조와 염기서열의 변이로부터 발생한다. 한 개인이 갖는 특정 유전체 염기서열 정보에 따라 항암제 대사가 느리거나 빠르기 때문에 항암제에 대한 효과 및 부작용이 개인마다 차이가 있을 수 있다.Cancer is the leading cause of death, accounting for 10% of all deaths over the age of 75 worldwide, and arises from mutations in genome structure and nucleotide sequence. Because anticancer drug metabolism is slow or fast depending on the specific genome sequence information possessed by an individual, the effects and side effects of anticancer drugs may differ from individual to individual.

생명공학 기술의 발전으로 인해 현재는 인간의 전 유전체 염기서열(whole genome sequence)을 분석하여 개개인의 질병을 예측하고 맞춤형 질병 예방 및 치료 방법을 제공하는 단계까지 도달하였다.Due to the development of biotechnology, we have reached the stage of predicting individual diseases by analyzing the human whole genome sequence and providing customized disease prevention and treatment methods.

유전체학의 급속한 발전으로 암의 병인론으로 유전체의 불안정성과 누적된 변형이 정설로 정립되었으며, 유전체의 고속대용량 분석 및 정보처리 신기술의 급속한 발전으로 선진국에서는 실제 임상적용이 빠르게 실현되고 있다. With the rapid development of genomics, the instability and cumulative transformation of the genome have been established as the orthodoxy as the etiology of cancer.

종래 공지된 합성치사(synthetic lethality, SL) 개념은 유전자 쌍에서 어느 한 쌍 모두 손상 시 세포가 사망 혹은 억제되는 현상이다. 그러나 이와 같은 합성 치사 관계에 있는 유전자 쌍이 있는 세포는 사멸되고 말기 때문에 실제 암조직에서 관찰이 잘 되지 않으므로 연구에 어려움이 존재한다.Conventionally known synthetic lethality (synthetic lethality, SL) concept is a phenomenon in which cells are killed or suppressed when any one pair in a gene pair is damaged. However, since cells with a gene pair in such a synthetic lethal relationship die off, it is difficult to observe in actual cancer tissues, so there is a difficulty in research.

반면, 조건부 합성치사 (conditional synthetic lethality, CSL) 혹은 합성 세포독성 상호작용 (synthetic cytotoxic interaction)의 개념에서는, 특히 세포독성 항암제 사용에 있어 특정 유전자 쌍에 모두 손상이 있어도 세포 사멸을 일으키지는 않지만, 추가적으로 항암제를 처리했을 때 일반 세포보다 낮은 농도의 항암제 치료에서도 효과를 볼 수 있다. 이는 해당 유전자 쌍에 모두 손상이 있어도 자연적으로는 세포사멸을 유도하지 않기에 합성치사 유전자 쌍이 있는 세포보다 실제 암조직에서 더 많이 관찰된다. 그러나 이 개념에서 기존의 연구들은 대부분 실제 인간을 대상으로 한 검증에 실패하였고, 일부 모델 생물들에서 발견한 합성세포독성 상호작용 역시, 특정 세포독성 항암제의 독성에 취약해지는 세포주위 환경의 변화와 연관된 유전자 쌍을 발견함에 그쳐 한계가 존재한다.On the other hand, in the concept of conditional synthetic lethality (CSL) or synthetic cytotoxic interaction, especially in the use of cytotoxic anticancer drugs, even if all of a specific gene pair is damaged, it does not cause apoptosis, but additionally When an anticancer drug is treated, it can be effective even in the treatment of a lower concentration of anticancer drug than normal cells. This is observed more in actual cancer tissues than in cells with a synthetic lethal gene pair because it does not naturally induce apoptosis even if all of the gene pairs are damaged. However, most of the existing studies on this concept failed to verify the actual human subjects, and the synthetic cytotoxic interactions found in some model organisms are also related to changes in the environment around cells that make them vulnerable to the toxicity of specific cytotoxic anticancer drugs. There is a limit to only discovering gene pairs.

이와 같은 합성치사의 다양한 확장 개념은 항암제 치료 반응에 매우 유용한 예측방법이지만, 합성치사 관계에 있는 유전자 쌍 검출의 double knockout이나 대규모 shRNA 실험 등은 너무 큰 실험비용과 긴 시간이 소요되어, 다중 유전체 빅데이터 기반의 생물정보학적 방법의 개발이 요구된다. 또한 암종별, 개별 약물별 조건부 합성치사 관계를 확인하는 것은 매우 소모적인 과정이다. 최근 매우 풍부한 약물 반응 실험데이터와 대규모 암환자 데이터베이스가 공개됨에 따라 가설에 제한이 없는 유전자 쌍-약물 조합의 관계를 확인하는 것이 가능해졌다. 따라서 다중 오믹스 데이터 기반의 생물정보학적 방법의 스크리닝 기법을 적용하여 암 치료제 반응성 예측 유전자 쌍을 검출하고 이를 효과적으로 검증할 방법론 개발의 필요성이 강하게 제기된다.Although these various extension concepts of synthetic lethality are very useful predictive methods for the response to anticancer drugs, double knockout or large-scale shRNA experiments for detecting gene pairs in a synthetic lethality relationship require too much experimentation cost and long time. The development of data-based bioinformatics methods is required. Also, confirming the conditional synthetic lethality relationship for each cancer type and individual drug is a very exhausting process. Recently, as very abundant drug response experimental data and large-scale cancer patient databases have been made public, it has become possible to confirm the relationship between a gene pair and a drug combination without limiting hypotheses. Therefore, there is a strong need to develop a methodology to detect and effectively verify a cancer treatment responsiveness predictive gene pair by applying a screening technique of a bioinformatic method based on multiple omics data.

한국등록특허 제1524562호Korean Patent No. 1524562

본 발명은 상호 협력적 암 치료제 반응(synergistic chemo-therapeutic interaction, SCI) 예측 유전자 쌍을 선별하는 방법에 관한 것이다.The present invention relates to a method for selecting a synergistic chemo-therapeutic interaction (SCI) predictive gene pair.

1. 복수개의 암세포 중 소정 개수 이상의 세포에서 변이가 있는 유전자를 선별하는 제1 단계; 상기 선별된 유전자를 2개씩 쌍을 지어 상기 세포들을 각 유전자 쌍의 유전자형 별로 WW, WM, MW 또는 MM(W는 야생형, M은 변이 유전자)으로 나누는 제2 단계; 상기 나눠진 세포들에 항암제를 처리하고 MM 유전자형 세포의 항암제 반응성을 다른 유전자형 세포들과 각각 비교하여, MM 유전자형 세포의 항암제 반응성이 다른 3개 유전자형 세포의 항암제 반응성 보다 큰 유전자 쌍을 선별하는 제3 단계; 및 상기 선별된 유전자 쌍 중 1) MM 유전자형 세포 그룹에서 항암제 반응성이 최소인 세포가 WW 유전자형 세포 그룹에서 항암제 반응성이 중간인 세포보다 항암제 반응성이 더 크거나,  2) MM 유전자형 세포 그룹의 항암제 반응성의 평균값이 4개 유전자형 세포 그룹 중 가장 큰 유전자 쌍을 선별하는 제4 단계;를 포함하는, 상호 협력적 암 치료제 반응 예측 유전자 쌍을 선별하는 방법.1. A first step of selecting a gene having a mutation in a predetermined number or more of a plurality of cancer cells; a second step of pairing the selected genes two by two and dividing the cells into WW, WM, MW or MM (W is wild type, M is a mutant gene) for each genotype of each gene pair; A third step of selecting a gene pair in which the anticancer drug reactivity of the MM genotype cells is greater than the anticancer drug reactivity of three genotype cells different by treating the divided cells with an anticancer agent and comparing the anticancer drug reactivity of the MM genotype cells with other genotype cells ; and 1) cells with the least anticancer drug reactivity in the MM genotype cell group have higher anticancer drug reactivity than the cells with the medium anticancer drug reactivity in the WW genotype cell group, or  2) the anticancer drug reactivity of the MM genotype cell group. A method of selecting a gene pair predicting a cooperative cancer treatment response, comprising a; a fourth step of selecting a gene pair having the largest average value among the four genotype cell groups.

2. 위 1에 있어서, 상기 변이는 기능상실변이(Loss of Funtion(LoF) mutations), 과오 돌연변이(missense mutations) 및 복제수 변이(Copy Number Variation(CNV)) 중 적어도 하나의 변이를 포함하는, 방법.2. The method of 1 above, wherein the mutation includes at least one mutation of loss of function (LoF) mutations, missense mutations and copy number variation (CNV). Way.

3. 위 2에 있어서, 상기 복제수 변이는 동형 접합 결실(deletion)인, 방법.3. The method of 2 above, wherein the copy number mutation is a homozygous deletion.

4. 위 1에 있어서, 상기 소정 개수는 5개인, 방법.4. The method according to 1 above, wherein the predetermined number is five.

5. 위 1에 있어서, 상기 제3 단계에서 MM 유전자형 세포 그룹의 항암제 반응성의 평균값을 다른 유전자형 세포 그룹의 항암제 반응성의 평균값과 각각 비교하는, 방법. 5. The method of 1 above, wherein in the third step, the average value of the anticancer drug reactivity of the MM genotype cell group is compared with the average value of the anticancer drug reactivity of the other genotype cell group, respectively.

6. 위 1에 있어서, 상기 제3 및 제4 단계에서 항암제 반응성의 비교는 IC50 값을 비교하는 것인, 방법.6. The method of 1 above, wherein the comparison of the anticancer drug reactivity in the third and fourth steps is to compare the IC 50 values.

본 발명은 변이 유전자 쌍을 보유한 세포군과 유전자 쌍 중 적어도 하나의 야생형 유전자를 포함하는 세포군 사이의 암 치료제에 대한 반응성을 비교하여 신속하고 간단하게 암 치료제에 대한 반응성을 나타내는 상호 협력적 암 치료제 반응 (synergistic chemo-therapeutic interaction, SCI) 예측 유전자 쌍을 선별하는 방법을 제공할 수 있다.The present invention compares the reactivity to a cancer treatment between a cell population having a mutated gene pair and a cell population containing at least one wild-type gene among the gene pair, thereby providing a cooperative cancer treatment response that quickly and simply shows the reactivity to the cancer treatment agent ( It is possible to provide a method for selecting a synergistic chemo-therapeutic interaction (SCI) prediction gene pair.

도 1은 손상 돌연변이를 확인하기 위한 데이터 선택 과정의 개략도이다.
도 2는 손상 돌연변이 데이터에 대한 데이터 처리과정의 세부적인 플로우 차트이다.
도 3은 후보 SCI 유전자 쌍의 선택 과정에 대한 순서도이다.
도 4는 약물과 SCI 유전자 쌍 사이의 hierarchal 클러스터링 결과이다.
도 5는 BRAF와 BRAF-MAPK 경로 타겟팅 약물과 관련된 SCI 유전자 쌍에서 4개 그룹 간의 IC50 값을 비교한 것이다.
도 6은 SCI 유전자 쌍을 포함하는 약물-세포주 기원의 클러스터링 분석 결과이다.
도 7은 990개 세포주의 조직 기원 및 BRAF 관련 SCI 유전자 쌍을 포함하는 49개 MM 유전자형 세포주에 대한 조직의 기원 분포를 나타낸 것이다.
도 8은 49개의 BRAF 관련 MM 유전자형 세포주와 관련된 BRAF/MAPK 경로 타겟팅 약물의 Heat map이다.
도 9는 BRAF/MAPK 경로 타겟팅 약물에 대한 4개 유전자형 그룹의 IC50값의 비교 결과이다.
도 10 내지 도 11은 3개 약물(dabrafenib, refametinib 및 trametinib)에 대한 BRAF 관련된 파트너 유전자 간의 부가효과를 확인한 것이다.
도 12는 BRAF 억제제 약물 처리된 환자의 생존 분석결과이다.
도 13 내지 도 15는 BRAF와 GPR112 공존시의 GDSC 및 TCGA 분석결과이다.
1 is a schematic diagram of the data selection process for identifying damaging mutations.
Figure 2 is a detailed flow chart of the data processing process for the damage mutation data.
3 is a flowchart of the selection process of candidate SCI gene pairs.
4 is a hierarchal clustering result between drug and SCI gene pair.
5 is a comparison of IC 50 values between four groups in SCI gene pairs related to BRAF and BRAF-MAPK pathway targeting drugs.
6 is a result of clustering analysis of a drug-cell line origin including an SCI gene pair.
7 shows the tissue origin of 990 cell lines and the distribution of tissue origin for 49 MM genotype cell lines containing BRAF-related SCI gene pairs.
8 is a heat map of BRAF/MAPK pathway targeting drugs associated with 49 BRAF-related MM genotype cell lines.
9 is a comparison result of IC 50 values of four genotype groups for BRAF/MAPK pathway targeting drugs.
10 to 11 confirm the additive effect between the BRAF-related partner genes for the three drugs (dabrafenib, refametinib and trametinib).
12 is a survival analysis result of a patient treated with a BRAF inhibitor drug.
13 to 15 are GDSC and TCGA analysis results when BRAF and GPR112 coexist.

이하, 본 발명을 상세히 설명한다.Hereinafter, the present invention will be described in detail.

본 발명은 복수개의 암세포 중 소정 개수 이상의 세포에서 변이가 있는 유전자를 선별하는 제1 단계; 상기 선별된 유전자를 2개씩 쌍을 지어 상기 세포들을 각 유전자 쌍의 유전자형 별로 WW, WM, MW 또는 MM(W는 야생형, M은 변이 유전자)으로 나누는 제2 단계; 상기 나눠진 세포들에 항암제를 처리하고 MM 유전자형 세포의 항암제 반응성을 다른 유전자형 세포들과 각각 비교하여, MM 유전자형 세포의 항암제 반응성이 다른 3개 유전자형 세포의 항암제 반응성 보다 큰 유전자 쌍을 선별하는 제3 단계; 및 상기 선별된 유전자 쌍 중 1) MM 유전자형 세포 그룹에서 항암제 반응성이 최소인 세포가 WW 유전자형 세포 그룹에서 항암제 반응성이 중간인 세포보다 항암제 반응성이 더 크거나, 2) MM 유전자형 세포 그룹의 항암제 반응성의 평균값이 4개 유전자형 세포 그룹 중 가장 큰 유전자 쌍을 선별하는 제4 단계;를 포함하는, 상호 협력적 암 치료제 반응 예측 유전자 쌍을 선별하는 방법을 제공한다.The present invention provides a method comprising: a first step of selecting a gene having a mutation in a predetermined number or more of a plurality of cancer cells; a second step of pairing the selected genes two by two and dividing the cells into WW, WM, MW or MM (W is wild type, M is a mutant gene) for each genotype of each gene pair; Treatment of the divided cells with an anticancer agent and comparing the anticancer drug reactivity of the MM genotype cells with other genotype cells, respectively, a third step of selecting a gene pair in which the anticancer drug reactivity of the MM genotype cells is greater than the anticancer drug reactivity of the other three genotype cells ; and 1) cells with the least anticancer drug reactivity in the MM genotype cell group have higher anticancer drug reactivity than the cells with the medium anticancer drug reactivity in the WW genotype cell group, or 2) the anticancer drug reactivity of the MM genotype cell group It provides a method for selecting a gene pair for predicting a cooperative cancer treatment response, including; a fourth step of selecting a gene pair having the largest average value among the four genotype cell groups.

본 발명에 있어서, 상호 협력적 암 치료제 반응(synergistic chemo-therapeutic interaction, SCI) 예측 유전자 쌍(본 명세서에서는 'SCI 유전자 쌍'으로 간략히 호칭함)은 암세포 또는 암조직에 포함된 특정 두 유전자의 변이 유전자 조합이 그 세포 또는 조직이 특정의 항암제에 대해서 더 높은 반응성을 나타내는 경우에 그 유전자 쌍을 지칭하는 것이다. 해당 두 유전자 모두 변이된 경우 세포 사멸을 일으키지는 않지만, 그 세포에 특정 항암제를 처리했을 때 해당 두 유전자 중 어느 하나 이상이 정상인 세포보다 더 낮은 농도의 항암제에 대해서도 높은 반응성을 나타내는 경우에 그 유전자 쌍을 SCI 유전자 쌍이라고 한다.In the present invention, a synergistic chemo-therapeutic interaction (SCI) predictive gene pair (hereinafter referred to as 'SCI gene pair') is a mutation of two specific genes included in cancer cells or cancer tissues. A gene combination refers to a gene pair when the cell or tissue exhibits a higher responsiveness to a particular anticancer agent. If both genes are mutated, they do not cause apoptosis, but when the cells are treated with a specific anticancer agent, at least one of the two genes exhibits high reactivity to a lower concentration of the anticancer agent than in normal cells. are called SCI gene pairs.

SCI 유전자 쌍은 특정의 항암제와 서로 매칭되는 것으로서, SCI 유전자 쌍은 항암제 별로 존재할 수 있는 것이고, 하나의 항암제에 대해 복수개의 SCI 유전자 쌍이 존재할 수도 있다.The SCI gene pair is matched with a specific anticancer agent, and the SCI gene pair may exist for each anticancer agent, and a plurality of SCI gene pairs may exist for one anticancer agent.

본 발명의 방법은 하나의 항암제에 대한 SCI 유전자 쌍을 선별하는 것일 수도 있고, 복수개의 항암제에 대한 각각의 SCI 유전자 쌍을 선별하는 것일 수 있다. 복수개의 항암제에 대한 SCI 유전자 쌍을 선별하는 경우에는 각 단계가 항암제 별로 따로 수행되는 것일 수 있다.The method of the present invention may be to select an SCI gene pair for one anticancer agent, or to select each SCI gene pair for a plurality of anticancer agents. In the case of selecting the SCI gene pair for a plurality of anticancer agents, each step may be separately performed for each anticancer agent.

복수개의 암세포는 암종에 제한되지 않고, 서로 다른 암종의 조직으로부터 유래한 암세포를 포함할 수 있다. 또한, 동일 환자로부터 분리된 암세포이든 서로 다른 환자로부터 분리된 암세포이든 제한이 없다. 또한, 실제 환자로부터 채취한 암세포가 아닌 실험실에서 인위적으로 증식시킨 암세포를 포함할 수 있다.The plurality of cancer cells is not limited to carcinoma, and may include cancer cells derived from tissues of different carcinomas. In addition, there is no limitation whether the cancer cells are isolated from the same patient or cancer cells isolated from different patients. In addition, it may include cancer cells artificially proliferated in a laboratory rather than cancer cells collected from actual patients.

본 발명은 복수개의 암세포에 포함된 다양한 유전자 중 소정 개수 이상의 세포에서 변이가 있는 유전자를 선별할 수 있다. 소정 개수는 특별히 제한되지 않으나, 예를 들면 5개 이상 또는 10개 이상일 수 있다. 그 상한은 예를 들면 전체 모집단 세포주 또는 조직 개수의 10 내지 30%일 수 있다. 상기 개수는 분석 대상이 되는 모집단을 얼마나 엄격한 기준으로 선정하는지에 관련된 것으로서, 상기 수가 작은 경우에는 모집단의 수가 많아져 실제로 SCI 유전자 쌍이지만 선별에서 빠지는 경우를 최소화할 수 있으나, 후속 단계에서의 조합 가능한 유전자 쌍의 수가 많아지기 때문에 그만큼 후속 단계에 소요되는 시간, 비용이 크게 증가할 수 있다. 반대로, 상기 수가 많은 경우에는 모집단 수가 적어져 신속하게 SCI 유전자 쌍의 선별이 가능하지만, 실제로 SCI 유전자 쌍이지만 선별에서 빠지는 경우가 발생할 수 있다. 따라서, 상기 소정 개수는 선별에 소요되는 시간, 비용, 정확도 등을 고려하여 상기 범위 내에서 적절하게 선택될 수 있다.In the present invention, it is possible to select a gene having a mutation in a predetermined number or more of various genes included in a plurality of cancer cells. The predetermined number is not particularly limited, but may be, for example, 5 or more or 10 or more. The upper limit may be, for example, 10 to 30% of the total number of cell lines or tissues in the population. The number is related to how strict the criteria for selecting the population to be analyzed. If the number is small, the number of the population increases, which is actually an SCI gene pair, but it is possible to minimize the case of missing from the selection, but it is possible to combine in a subsequent step. As the number of gene pairs increases, the time and cost required for subsequent steps may increase significantly. Conversely, when the number is large, the number of populations decreases and selection of SCI gene pairs is possible quickly. However, although the SCI gene pairs are actually SCI gene pairs, a case may occur that is omitted from selection. Accordingly, the predetermined number may be appropriately selected within the above range in consideration of time, cost, accuracy, etc. required for selection.

변이는 예를 들면 기능상실변이(Loss of Funtion(LoF) mutations), 과오 돌연변이(missense mutations) 및 복제수 변이(Copy Number Variation(CNV)) 중 적어도 하나의 변이를 포함할 수 있다.The mutation may include, for example, at least one of loss of function (LoF) mutations, missense mutations, and copy number variation (CNV).

기능상실변이는 넌센스 돌연변이(nonsense mutation), 종결 상실 돌연변이(stop-loss mutation), 격자이동 돌연변이(frameshift mutation) 또는 스플라이스 장소 돌연변이(splice site mutation)를 포함할 수 있으나, 이에 제한되지 않는다.The loss-of-function mutation may include, but is not limited to, a nonsense mutation, a stop-loss mutation, a frameshift mutation, or a splice site mutation.

복제수 변이는 동형 접합 결실(deletion)일 수 있다.The copy number variation may be a homozygous deletion.

과오 돌연변이가 있는 유전자는 유전자 변이 점수에 의해 손상 변이 여부를 결정할 수 있다. 유전자 변이 점수는 유전체 염기서열 변이가 단백질을 코딩하는 유전자의 엑손 부위에서 발견되었을 때, 이러한 개별 변이가 해당 유전자가 코딩하는 단백질의 아미노산 서열 변이(치환, 부가 또는 결실) 또는 전사 조절 변이 등을 초래하여, 해당 단백질의 구조 및/또는 기능에 유의한 변화 혹은 손상을 유발하는 정도를 수치화한 점수를 말하며, 상기 유전자 변이 점수는 유전체 염기서열 상에서 아미노산의 진화론적 보존 정도, 변형된 아미노산의 물리적 특성에 따른 해당 단백질의 구조나 기능의 변화에 미치는 정도 등을 고려하여 산출할 수 있다.Genes with malformation mutations can determine whether or not they have damaging mutations by the gene mutation score. Gene mutation score is when genomic sequence mutations are found in the exon region of a gene encoding a protein, such individual mutations result in amino acid sequence mutation (substitution, addition or deletion) or transcriptional regulation mutation of the protein encoded by the gene. Thus, it refers to a score quantifying the degree to which a significant change or damage to the structure and/or function of the protein is caused, and the gene mutation score is based on the degree of evolutionary conservation of amino acids in the genome sequence and the physical properties of the modified amino acids. It can be calculated in consideration of the degree of influence on changes in the structure or function of the corresponding protein.

유전자 변이 점수 산출은 통상의 기술자에 공지된 방법을 이용하여 수행될 수 있다. 예를 들면, SIFT (Sorting Intolerant From Tolerant), PolyPhen, PolyPhen-2(Polymorphism Phenotyping), MAPP (Multivariate Analysis of Protein Polymorphism), Logre (Log R Pfam Evalue), Mutation Assessor, Condel, GERP (Genomic Evolutionary Rate Profiling), CADD (Combined Annotation-Dependent Depletion), MutationTaster, MutationTaster2, PROVEAN, PMuit, CEO (Combinatorial Entropy Optimization), SNPeffect, fathmm, MSRV (Multiple Selection Rule Voting), Align-GVGD, DANN, Eigen, KGGSeq, LRT (Likelihood Ratio Test), MetaLR, MetaSVM, MutPred, PANTHER, Parepro, phastCons, PhD-SNP, phyloP, PON-P, PON-P2, SiPhy, SNAP, SNPs&GO, VEP (Variant Effect Predictor), VEST (Variant Effect Scoring Tool), SNAP2, CAROL, PaPI, Grantham, SInBaD, VAAST, REVEL, CHASM (Cancer-specific Highthroughput Annotation of Somatic Mutations), mCluster, nsSNPAnayzer, SAAPpred, HanSa, CanPredict, FIS 및 BONGO(Bonds ON Graphs)로 이루어진 군에서 선택된 하나 이상의 알고리즘을 이용하여 수행될 수 있다. 이를 각 해당 유전자가 보유한 유전자 염기서열 변이에 적용하여 산출된 하나 이상의 유전자 염기서열 변이 점수를 종합하여 계산된 점수로부터 변이 유전자가 결정될 수 있다.Genetic variation score calculation can be performed using methods known to those skilled in the art. For example, SIFT (Sorting Intolerant From Tolerant), PolyPhen, PolyPhen-2 (Polymorphism Phenotyping), MAPP (Multivariate Analysis of Protein Polymorphism), Logre (Log R Pfam Evalue), Mutation Assessor, Condel, GERP (Genomic Evolutionary Rate Profiling) ), CADD (Combined Annotation-Dependent Depletion), MutationTaster, MutationTaster2, PROVEAN, PMuit, CEO (Combinatorial Entropy Optimization), SNPeffect, fathmm, MSRV (Multiple Selection Rule Voting), Align-GVGD, DANN, Eigen, KGGSeq, LRT ( Likelihood Ratio Test), MetaLR, MetaSVM, MutPred, PANTHER, Parepro, phastCons, PhD-SNP, phyloP, PON-P, PON-P2, SiPhy, SNAP, SNPs&GO, VEP (Variant Effect Predictor), VEST (Variant Effect Scoring Tool) ), SNAP2, CAROL, PaPI, Grantham, SInBaD, VAAST, REVEL, CHASM (Cancer-specific Highthroughput Annotation of Somatic Mutations), mCluster, nsSNPAnayzer, SAAPpred, HanSa, CanPredict, FIS and BONGO (from the group consisting of Graphs on Bonds) It may be performed using one or more selected algorithms. A mutated gene may be determined from a score calculated by synthesizing one or more gene nucleotide sequence mutation scores calculated by applying this to the gene nucleotide sequence mutation possessed by each corresponding gene.

제2 단계에서는 제1 단계에서 선별된 유전자를 2개씩 쌍을 지을 수 있다. 예를 들어, 제1 단계에서 선별된 유전자가 10개라면, 45개의 유전자 쌍이 조합될 수 있다(10C2).In the second step, two genes selected in the first step may be paired. For example, if there are 10 genes selected in the first step, 45 gene pairs can be combined ( 10 C 2 ).

각 유전자는 변이 유형에 따라 야생형(W) 또는 변이 유전자형(M)으로 구분할 수 있다.Each gene can be divided into wild type (W) or mutant genotype (M) according to the type of mutation.

복수개의 암세포는 각 유전자 쌍의 유전자형 별로 WW, WM, MW, MM 유형으로 나눌 수 있다. 이때, 각 유전자 쌍의 유전자형 별로 2개 이상, 바람직하게는 3개 이상, 더욱 바람직하게는 5개 이상의 세포가 존재하는 경우에 본 발명의 방법을 적용하는 것이 신뢰도 측면에서 바람직하나 이에 제한되는 것은 아니다.A plurality of cancer cells can be divided into WW, WM, MW, and MM types for each genotype of each gene pair. At this time, it is preferable in terms of reliability to apply the method of the present invention when there are 2 or more, preferably 3 or more, more preferably 5 or more cells for each genotype of each gene pair, but is not limited thereto. .

제3 단계는 상기 나눠진 세포들에 항암제를 처리하는 단계를 포함한다. 항암제는 항암 효과가 있는 것으로 공지된 약물을 제한 없이 사용할 수 있다. 예를 들어, 화학항암제, 표적항암제 및 면역항암제 등을 포함할 수 있다.The third step includes treating the divided cells with an anticancer agent. The anticancer agent may be used without limitation, a drug known to have an anticancer effect. For example, it may include a chemical anti-cancer agent, a targeted anti-cancer agent, and an immuno-oncology agent.

화학항암제는 예를 들면 머스타젠, 사이클로포스파마이드(Cyclophosphamide), 이포스파마이드(ifosfamide), 디카바진(DTIC), 시스플라틴, 헵타플라틴 또는 타목시펜 등을 포함할 수 있다.Chemotherapy may include, for example, mustagen, cyclophosphamide, ifosfamide, dicarbazine (DTIC), cisplatin, heptaplatin, or tamoxifen.

표적항암제는 예를 들면 이매티닙, 세툭시맙, 게피티닙, 올무티닙, 오시머티닙, 베바시주맙, 소라페닙 또는 수니티닙 등을 포함할 수 있다.The targeted anticancer agent may include, for example, imatinib, cetuximab, gefitinib, olmutinib, osimertinib, bevacizumab, sorafenib or sunitinib.

면역항암제는 예를 들면 펨브롤리주맙, 니볼루맙, 아벨루맙, 더발루맙 또는 여보이 등을 포함할 수 있다.The immuno-cancer agent may include, for example, pembrolizumab, nivolumab, avelumab, durvalumab or yervoy.

제3 단계에서 항암제 처리된 세포 중 MM 유전자형 세포의 항암제 반응성을 다른 유전자형 세포들과 각각 비교한다.In the third step, the anticancer drug reactivity of MM genotype cells among the anticancer drug-treated cells is compared with other genotype cells, respectively.

본 발명의 방법은 상기 제3 단계에서 MM 유전자형 세포의 항암제 반응성을 다른 유전자형 세포들과 각각 비교함으로써 그 항암제 반응성 비교에 소요되는 시간, 비용을 현저히 줄일 수 있다.The method of the present invention can significantly reduce the time and cost required for comparing the anticancer drug responsiveness of the MM genotype cells to those of other genotype cells, respectively, in the third step.

상기 각각 비교한다는 것은 1) 전체 유전자 변이에 대한 유전자 쌍을 도출하는 것이 아닌 변이의 filtering 을 거친 이후의 유전자 쌍에 대해 분석을 하는 것과 2) 하나의 유전자 쌍에 대해서 MM vs WW, MM vs WM, MM vs MW, 이렇게 총 3회의 비교를 수행하는 것과, 3) MM 유전자형이 나타나는 세포주의 최소 개수로 필터링을 하는 것을 포함한다. 이는 SCI 유전자 쌍 도출을 위해 단순 변이 여부에 따른 all-pair wise test를 하고 이를 다검사교정 (multiple testing correction)을 했을 때 실제로 유의한 SCI 쌍이 통계적 유의성을 잃어버릴 수 있는 가능성을 최소화 하며 동시에 반응성 비교를 위해 사용되는 분산 분석(Analysis of Variance, ANOVA) 대비 변수가 적기 때문에 계산에 소요되는 시간을 현저히 줄일 수 있다.Comparing each of the above means 1) not deriving a gene pair for the entire gene mutation, but analyzing the gene pair after mutation filtering, and 2) MM vs WW, MM vs WM, and MM vs WW for one gene pair. MM vs MW, a total of three comparisons, and 3) filtering to the minimum number of cell lines displaying the MM genotype. In order to derive SCI gene pairs, when all-pair wise tests are performed according to simple mutations and multiple testing corrections are made, it minimizes the possibility that the SCI pairs that are actually significant may lose their statistical significance and at the same time compares reactivity. Compared to the Analysis of Variance (ANOVA) used for the calculation, the calculation time can be significantly reduced because there are fewer variables.

본 발명의 방법은 SCI 유전자 쌍을 도출하는 것으로서, 제1 단계에서 다수의 유전자가 선별되어, 제2 단계에서 굉장히 많은 유전자 쌍의 조합이 얻어질 것이므로, 제3 단계에서 비교해야 하는 집단이 굉장히 많이 얻어질 수 있다. 예를 들어, 본원 실시예에서는 제1 단계에서 3804개의 유전자를 선별하였고, 제2 단계의 유전자 쌍의 조합은 3804C2로서 7,233,306 개가 얻어졌는데, MM 유전자형 세포 그룹의 항암제 반응성을 다른 세포 그룹의 항암제 반응성과 각각 비교하는 경우에는, 약 1000개의 세포주에 대한 250개 약물 실험 결과를 분석한다고 할 때, 16G SATA 서버에서 단순 for loop 로 3년, 병렬 for loop 로 200일의 시간이 소요될 것으로 계산되었으나, 본 연구의 방법에 따른 변이의 개수별 필터링과 분산 분석으로 그 반응성을 비교하고자 한다면 기능상실변이의 경우는 2-3시간, 기타 missense 변이의 경우 약 4일의 시간이 소요되게 되므로, 이러한 차이는 SCI 유전자 쌍을 도출하는 방법에서 굉장히 큰 효과 차이로 나타난다.The method of the present invention is to derive SCI gene pairs, and since a large number of genes are selected in the first step, and a very large number of gene pairs combinations will be obtained in the second step, the population to be compared in the third step is very large can be obtained For example, in the present Example, 3804 genes were selected in the first step, and 7,233,306 were obtained as 3804 C 2 as a combination of gene pairs in the second step. In case of comparing reactivity, it was calculated that it would take 3 years for simple for loop and 200 days for parallel for loop on 16G SATA server when analyzing 250 drug test results for about 1000 cell lines. If you want to compare the reactivity with filtering by number of mutations and analysis of variance according to the method of this study, it takes 2-3 hours for loss-of-function mutations and about 4 days for other missense mutations. It appears that there is a very large effect difference in the method of deriving the SCI gene pair.

비교는 당 분야에 공지된 통계적 기법을 사용하여 비교할 수 있으며, 예를 들면 student' t test를 사용할 수 있으나, 이에 제한되는 것은 아니다.The comparison may be performed using a statistical technique known in the art, for example, a student' t test may be used, but is not limited thereto.

항암제 반응성은 당 분야에 공지된 약물 반응성 기준을 사용하여 비교할 수 있고, 예를 들면 IC50, EC50, GI50, LD50 또는 세포 생존률(%)을 사용할 수 있으며, 구체적으로는 IC50을 비교할 수 있으나, 이에 제한되는 것은 아니다.Anticancer drug reactivity can be compared using drug reactivity criteria known in the art, for example, IC 50 , EC 50 , GI 50 , LD 50 or cell viability (%) can be used, and specifically, IC 50 can be compared However, it is not limited thereto.

항암제 반응성 비교시에 IC50 값을 비교하는 경우, 이하에서 항암제 반응성이 높다는 것은 IC50 값이 작다는 것을 의미할 수 있고, 항암제 반응성이 낮다는 것은 IC50 값이 크다는 것을 의미할 수 있다.When comparing IC 50 values when comparing anticancer drug reactivity, a high anticancer drug reactivity in the following may mean a small IC 50 value, and a low anticancer drug reactivity may mean a large IC 50 value.

제3 단계에서 MM 유전자형 세포의 항암제 반응성이 다른 3개의 유전자형 세포의 항암제 반응성 보다 큰 경우에 SCI 유전자 쌍 후보로 선별할 수 있다.In the third step, when the anticancer drug reactivity of the MM genotype cells is greater than the anticancer drug reactivity of the other three genotype cells, SCI gene pair candidates can be selected.

IC50 값으로 항암제 반응성을 비교하는 경우, 제3 단계는 MM 유전자형 세포 그룹의 IC50 평균값을 다른 3개의 유전자형 세포 그룹의 IC50 평균값과 각각 비교하여 MM 유전자형 세포 그룹의 IC50 평균값이 작은 경우 후보 SCI 유전자 쌍으로 선별할 수 있다.When comparing cancer reactivity in IC 50 value, the third step is when the respective comparing the IC 50 mean value of the MM genotype cell group and the IC 50 mean value of the three different genotypes cell group a small IC 50 mean value of the MM genotype cell group candidate SCI gene pairs can be selected.

항암제 반응성은 각 세포 그룹의 세포 별로 계산된 항암제 반응성의 평균값을 비교할 수 있다. 구체적으로 MM 유전자형 세포 그룹의 항암제 반응성의 평균값을 다른 유전자형 세포 그룹의 항암제 반응성의 평균값과 각각 비교할 수 있다.The anticancer drug reactivity may be compared with the average value of the anticancer drug reactivity calculated for each cell of each cell group. Specifically, the average value of the anticancer drug reactivity of the MM genotype cell group may be compared with the average value of the anticancer drug reactivity of other genotype cell groups, respectively.

평균값은 예를 들면, 기하평균, 산술평균, 조화평균, 산술기하평균, 산술조화평균, 기하조화평균, 피타고라스 평균, 사분평균, 이차평균, 절삭평균, 윈저화 평균, 가중평균, 가중기하평균, 가중산술평균, 가중조화평균, 함수의 평균, 멱평균 또는 일반화된 f-평균으로 계산될 수 있으나, 이에 제한되지 않는다.The mean value is, for example, geometric mean, arithmetic mean, harmonic mean, arithmetic geometric mean, arithmetic harmonic mean, geometric harmonic mean, Pythagorean mean, quadrant mean, quadratic mean, cutting mean, Windsor mean, weighted mean, weighted geometric mean, It may be calculated as a weighted arithmetic mean, a weighted harmonic mean, a function mean, a power mean, or a generalized f-mean, but is not limited thereto.

제4 단계는 제3 단계에서 선별된 유전자 쌍 중 1) MM 유전자형 세포 그룹에서 항암제 반응성이 최소인 세포가 WW 유전자형 세포 그룹에서 항암제 반응성이 중간인 세포보다 항암제 반응성이 더 큰 경우, 2) MM 유전자형 세포 그룹의 항암제 반응성의 평균값이 4개 유전자형 세포 그룹 중 가장 큰 경우 중 적어도 하나를 만족하는 유전자 쌍을 SCI 유전자 쌍으로 선별할 수 있다.In the fourth step, among the gene pairs selected in step 3, 1) cells with the least anticancer drug reactivity in the MM genotype cell group have greater anticancer drug reactivity than the cells with the medium anticancer drug reactivity in the WW genotype cell group, 2) MM genotype A gene pair satisfying at least one of the cases in which the average value of the anticancer drug reactivity of the cell group is the largest among the four genotype cell groups may be selected as the SCI gene pair.

예를 들어, IC50 값으로 항암제 반응성을 비교하는 경우, 제3 단계에서 선별된 SCI 유전자 쌍 후보 중 1) MM 유전자형 세포 그룹에서 IC50 의 최대값이 WW 유전자형 세포 그룹의 IC50의 중앙값보다 더 작은 경우, 2) MM 유전자형 세포 그룹의 IC50의 평균값이 4개 유전자형 세포 그룹 중 가장 작은 경우 중 적어도 하나를 만족하는 유전자 쌍을 SCI 유전자 쌍으로 선별할 수 있다.For example, when comparing anticancer drug reactivity with IC 50 values, among the SCI gene pair candidates selected in step 3, 1) the maximum value of IC 50 in the MM genotype cell group was higher than the median IC 50 value of the WW genotype cell group. In the case of small, 2) a gene pair satisfying at least one of the cases in which the IC 50 of the MM genotype cell group is the smallest among the four genotype cell groups may be selected as the SCI gene pair.

본 발명의 방법은 제3 단계에서 SCI 유전자 쌍 후보를 선별하는데 소요되는 시간을 줄이되, 제4 단계에서 상기 기준을 추가하여, 짧은 시간 내에 정확하게 SCI 유전자 쌍을 선별할 수 있다.The method of the present invention reduces the time required for selecting the SCI gene pair candidate in the third step, but by adding the above criteria in the fourth step, the SCI gene pair can be accurately selected within a short time.

제 4 단계의 상기 기준은 MM 유전자형 세포 그룹 내 항암제 반응성이 최소인 세포와 WW 유전자형 세포 그룹 내 항암제 반응성이 중간인 세포를 비교함으로써, 평균값을 비교하는 경우보다 MM 유전자형의 항암제 반응성이 다른 유전자형보다 확실하게 크다고 판단되는 SCI 유전자 쌍을 선별할 수 있어 임상적 유용성을 확보할 수 있다. 또한, MM 유전자형 세포 그룹과 WW 유전자형 세포 그룹에서 각각 하나의 값만을 비교하므로 분석 시간을 최소화 할 수 있다.The criterion of the fourth step is by comparing the cells with the least anticancer drug reactivity in the MM genotype cell group and the cells with the medium anticancer drug reactivity in the WW genotype cell group, the MM genotype's anticancer drug reactivity is more certain than other genotypes compared to the average value. Clinical usefulness can be secured because SCI gene pairs that are judged to be very large can be selected. In addition, since only one value is compared in the MM genotype cell group and the WW genotype cell group, the analysis time can be minimized.

이하, 본 발명을 구체적으로 설명하기 위해 실시예를 들어 상세하게 설명하기로 한다. Hereinafter, examples will be given to describe the present invention in detail.

실험방법Experimental method

1. 데이터 세트1. Dataset

먼저 GDSC (Genomics of Drug Sensitivity in Cancer) 데이터베이스를 사용하여 SCI를 보이는 후보 유전자 쌍을 선별하였다. GDSC 데이터는 1001개 암 세포주와 251개 화학물질에 대한 약물 민감도 프로파일을 포함하였다(https://www.cancerrxgene.org/downloads, accessed 21 March 2019). GDSC 프로젝트는 약물 민감도(반 최대 억제 농도 (IC50) 값) 및 세포주 분자 프로파일링 데이터를 포함한 분자 프로파일 데이터가 제공되었다. CNV(유전자 복제수 변이), WES (Whole-Exome Sequencing) 기반 변이체, DNA 메틸화 및 유전자 발현 데이터는 이 데이터베이스에서 세포주 분자 프로파일의 일부로 제공되었다. 이들 데이터 중에서, 전 처리된 세포주, CNV 데이터 및 WES 변이체 데이터로부터 약물 민감성 데이터를 수집하였다. WES 변이체 중에서, GDSC 데이터베이스에 의해 제공된 돌연변이 정보의 기능적 주석 분류에 기초하여 알려져 있거나 손상될 것으로 예상되는 돌연변이만을 추출하였다. CNV 데이터의 경우, 도 1과 같이 GDSC 데이터베이스에 의해 제공되는 주석 분류에서 동형 접합 결실(deletions)만 추출하였다.First, candidate gene pairs showing SCI were selected using the GDSC (Genomics of Drug Sensitivity in Cancer) database. GDSC data included drug sensitivity profiles for 1001 cancer cell lines and 251 chemicals (https://www.cancerrxgene.org/downloads, accessed 21 March 2019). The GDSC project provided molecular profiling data including drug sensitivity (half maximal inhibitory concentration (IC 50 ) values) and cell line molecular profiling data. Gene copy number variation (CNV), Whole-Exome Sequencing (WES) based variants, DNA methylation and gene expression data were provided as part of the cell line molecular profile in this database. Among these data, drug sensitivity data were collected from pre-treated cell lines, CNV data, and WES variant data. Among the WES variants, only those mutations known or predicted to be impaired based on the functional annotation classification of mutation information provided by the GDSC database were extracted. For CNV data, only homozygous deletions were extracted from the annotation classification provided by the GDSC database as shown in FIG. 1 .

이러한 기준에 기초하여, 990개의 세포주에 대한 데이터가 이용 가능하였고, 약물 민감성 반응이 251개의 약물에 대해 이용 가능하였다. 약물의 IC50 값을 마커로 사용하여, 2개의 손상 유전자가 손상 유전자가 하나만 있거나 또는 전혀 없는 세포주와 비교하여, 변이되었을 때, 약물에 대해 더 큰 민감성을 나타내는 지 여부를 결정하였다. 모든 990개 세포주에서 모든 약물에 대해 IC50 데이터가 이용 가능하지 않았기 때문에, IC50(μM) raw 값 (natural log scale)의 산술 평균을 사용하여 11,664개의 중복된 약물-세포주 쌍을 분석하였다. 두 번 이상 중복된 사례는 없었다. 대부분의 약물은 한번만 검사했지만 일부는 두 가지 검사실에서 테스트되었다. 이 경우 IC50의 산술 평균을 사용하였다.Based on these criteria, data were available for 990 cell lines and drug sensitization responses were available for 251 drugs. Using the IC 50 value of the drug as a marker, it was determined whether the two damaging genes exhibited greater sensitivity to the drug when mutated compared to cell lines with only one or no impaired gene. Because IC 50 data were not available for all drugs in all 990 cell lines, 11,664 duplicate drug-cell line pairs were analyzed using the arithmetic mean of IC 50 (μM) raw values (natural log scale). There were no cases of more than two duplicates. Most drugs were tested only once, but some were tested in two laboratories. In this case, the arithmetic mean of IC 50 was used.

세 번 이상 중복된 약물은 없었다. 약물 정보 데이터는 GDSC screened compounds database에서 얻어졌다.No drugs were duplicated more than three times. Drug information data were obtained from the GDSC screened compounds database.

생존 분석을 위해, TCGA Research Network (https://www.cancer.gov/tcga)에 의해 만들어진 Bioconductor(version3.9) 소프트웨어 패키지 TCGABiolinks(version2.12.5)로부터 얻어진 The Cancer Genome Atlas(TCGA) 데이터가 사용되었다. pan-cancer 분석을 위해 33개의 TCGA 암 프로젝트에서 다운로드한 화학 요법 정보를 포함한 체세포 돌연변이 데이터 및 임상 데이터가 현재 분석에 사용되었다.For survival analysis, The Cancer Genome Atlas (TCGA) data obtained from the Bioconductor (version3.9) software package TCGABiolinks (version2.12.5) produced by the TCGA Research Network (https://www.cancer.gov/tcga) were used. became For pan-cancer analysis, somatic mutation data and clinical data including chemotherapy information downloaded from 33 TCGA cancer projects were used in the current analysis.

2. 암 세포주에서 돌연변이 프로파일 분석2. Analysis of Mutation Profiles in Cancer Cell Lines

암 약물에 대한 SCI 유전자 쌍을 찾기 위해, 하나 이상의 loss-of-function(LoF) 돌연변이 및/또는 SIFT 및 PolyPhen에 따라 필터링 된 missense 및/또는 복제수 결실(copy number deletions) 돌연변이를 갖는 유전자로 정의된 크게 손상된 돌연변이만이 고려되었다. 돌연변이 데이터는 GDSC 데이터베이스에서 사전 처리된 WES 데이터로부터 추출되었다. 이 분석에 사용된 datasets 및 필터링 절차의 개략도는 도 1과 같고, 자세한 과정은 도 2에 나타내었다. WES 데이터로부터의 Stop-loss 및 nonsense 분류는 LoF 돌연변이를 손상시키는 것으로 간주되었다(n=23,846). 손상된 missense 돌연변이를 정의하기 위해 missense 돌연변이의 SIFT 및 PolyPhen 점수는 Ensembl Variant Effect Predictor를 사용하여 매핑되었다. GRCh37은 WES 데이터의 참조 게놈으로 사용되었다. Ensembl ID (ENST)-태그된 데이터를 나타내는 전사체(transcripts)만이 분석에 포함되었고, WES 데이터에서 유해하고 (SIFT 점수 <0.05) 대체로 손상된(PolyPhen 점수> 0.908) missense 돌연변이는 missense 돌연변이 손상으로 간주되었다(n = 96,886). CNV 데이터는 GDSC의 유전자 수준의 복제수 데이터로부터 얻었다. 동형 접합 결실은 복제수 결실(n = 21,475)인 것으로 간주되었다. 유전자-세포주 돌연변이 카운트 테이블은 990개의 세포주에서 총 19,100개의 유전자를 포함하여 LoF 돌연변이, 손상 missense 돌연변이, 복제수 결실 및 이들 세 가지 범주의 각각의 조립된 데이터로 구성되었다. 10개 미만의 세포주에서 손상 돌연변이를 갖는 유전자는 분석에서 제외시켰다. 필터링 후, 3,804 개의 유전자(7,233,306 개의 유전자-유전자 쌍)가 남았다.To find SCI gene pairs for cancer drugs, defined as genes with one or more loss-of-function (LoF) mutations and/or missense and/or copy number deletions mutations filtered according to SIFT and PolyPhen Only heavily damaged mutations that have been identified were considered. Mutation data were extracted from pre-processed WES data in the GDSC database. A schematic diagram of the datasets and filtering procedure used in this analysis is shown in FIG. 1 , and the detailed process is shown in FIG. 2 . Stop-loss and nonsense classifications from WES data were considered to impair LoF mutations (n=23,846). To define impaired missense mutations, the SIFT and PolyPhen scores of missense mutations were mapped using the Ensembl Variant Effect Predictor. GRCh37 was used as a reference genome for WES data. Only transcripts representing Ensembl ID (ENST)-tagged data were included in the analysis, and missense mutations that were deleterious (SIFT score <0.05) and largely impaired (PolyPhen score >0.908) in WES data were considered missense mutational impairments. (n = 96,886). CNV data were obtained from GDSC gene-level copy number data. Homozygous deletions were considered copy number deletions (n = 21,475). The gene-cell line mutation count table consisted of assembled data of LoF mutations, damaging missense mutations, copy number deletions and each of these three categories, including a total of 19,100 genes in 990 cell lines. Genes with damaging mutations in less than 10 cell lines were excluded from the analysis. After filtering, 3,804 genes (7,233,306 gene-gene pairs) remained.

3. SCI 세트를 식별하기 위한 약물 민감도 분석3. Drug Sensitivity Analysis to Identify SCI Sets

SCI 세트는 각 약물의 IC50 값과 세포주의 돌연변이 프로파일의 관계를 결정함으로써 확인되었다. SCI 세트의 선택 과정에 대한 순서도는 도 3과 같다. 쌍별 비교는 후보 SCI 세트를 식별하기 위해 특정 약물-유전자-유전자 상호 작용의 기본 가정 없이 251개 약물 각각에 대해 모든 유전자 쌍에 대해 수행되었다. 이전의 필터링 단계 (도 1)에서 포함된 3,804개의 유전자를 사용하여, 세포주는 유전자 쌍의 돌연변이 유형에 따라 WW, MW, WM 및 MM으로 4개의 그룹으로 나누었다(여기서 W는 야생형이고, M은 유전자의 손상 돌연변이이다). 따라서, 두 영문자는 둘 다 야생형, 둘 다 돌연변이 또는 하나는 야생형이고 다른 하나는 돌연변이인 2개의 유전자를 나타낸다. 특정 약물 D와 대응하는 특정 유전자 쌍 (A 및 B)에 대한 4개의 그룹 모두가 5개 이상의 세포주에 대한 데이터를 포함한 경우, 이들 유전자는 분석을 위해 유지되고, 자연 로그 변환 된 IC50 값의 평균을 MM 그룹과 다른 세 그룹과 비교하였다. 특정 약물에 대한 IC50 값을 갖는 시험된 세포주의 수는 약물마다 다양하기 때문에, 돌연변이 유형의 4가지 그룹도 약물에 따라 다양하였다. 따라서 약물 D를 선택하여 분석을 시작하였고, 해당 약물에 대한 IC50 값을 가진 세포주를 돌연변이 프로파일에 따라 4개의 그룹으로 나누었다. MM 그룹이 다른 세 그룹보다 IC50 값이 현저히 낮은 경우 이는 후보 SCI 세트를 설정하기 위한 "시너지 화학 요법 효과"를 나타내는 것으로 간주되었다. 추가 분석을 위해 MM 그룹의 최대 IC50 값이 WW 그룹의 중간 IC50 값보다 작은 조건을 만족하는 SCI 세트만 포함되었다. 이 의미 있는 SCI 세트의 클러스터가 확인되면, SCI 유전자 쌍의 파트너 유전자를 그룹화한 다음, 시너지 화학 요법 반응에 대한 조합된 유전자 세트의 부담 효과(burden effects)를 비교하였다. 즉, 유전자 B가 특정 약물 D에 대한 SCI 세트에 반복적으로 나타나고 확인된 SCI 쌍 중 유전자 B와 관련된 여러 유전자가 있는 경우, 유전자 B의 모든 파트너 유전자(Ps)를 결합시키고, 세포주를 B와 그 파트너에 대한 돌연변이 상태에 따른 그룹인 WW, MWs, WMs, MM으로 나누었다. 예를 들어, WMs은 유전자 B 자체가 아닌 유전자 B의 임의의 파트너 유전자에서 손상 돌연변이를 갖는 세포주 그룹을 나타낸 것이다.The SCI set was identified by determining the relationship between the IC 50 value of each drug and the mutation profile of the cell line. A flowchart of a process of selecting an SCI set is shown in FIG. 3 . Pairwise comparisons were performed for all gene pairs for each of the 251 drugs without the underlying assumption of specific drug-gene-gene interactions to identify a set of candidate SCIs. Using the 3,804 genes included in the previous filtering step (Figure 1), the cell lines were divided into four groups according to the mutation type of the gene pair: WW, MW, WM, and MM (where W is wild-type and M is the gene). is a damaging mutation of ). Thus, two alphabetic letters represent two genes, both wild-type, both mutant, or one wild-type and the other mutant. If all 4 groups for a specific drug D and corresponding specific gene pair (A and B) contained data for 5 or more cell lines, these genes were retained for analysis and the mean of the natural log transformed IC 50 values was compared with the MM group and the other three groups. Since the number of cell lines tested with IC 50 values for a particular drug varied from drug to drug, the four groups of mutation types also varied from drug to drug. Therefore, drug D was selected to start the analysis, and cell lines with IC 50 values for the drug were divided into 4 groups according to the mutation profile. If the MM group had significantly lower IC 50 values than the other three groups, this was considered to indicate a “synergistic chemotherapy effect” to establish a set of candidate SCIs. For further analysis, only the SCI sets satisfying the condition that the maximum IC 50 value of the MM group was smaller than the median IC 50 value of the WW group were included. Once a cluster of this meaningful SCI set was identified, the partner genes of the SCI gene pair were grouped and then the burden effects of the combined gene set on the synergistic chemotherapy response were compared. That is, if gene B appears repeatedly in the SCI set for a specific drug D and there are several genes related to gene B among the identified SCI pairs, all partner genes (Ps) of gene B are combined, and the cell line is transferred to B and its partner. It was divided into WW, MWs, WMs, and MM, which are groups according to mutation status. For example, WMs represent a group of cell lines with damaging mutations in any partner gene of gene B, but not in gene B itself.

4. 후보 SCI 세트의 군집 분석4. Cluster Analysis of Candidate SCI Sets

약물에 따라 SCI 세트를 클러스터링 하기 위해 먼저 GDSC 분류에 따라 공통의 일치된 타겟 단백질 또는 경로를 기반으로 약물을 분류하였다. SCI 세트와 MM 그룹의 세포주 사이의 관계를 확인하기 위해, 약물 및 세포주의 조직 기원에 대해 계층적 군집 분석(hierarchical clustering analysis)을 수행하였다. 완전한 연결 방법과 Euclidean 거리는 모든 계층 적 군집 분석에 사용되었다. 최종 군집 테이블은 계수 테이블의 drug-wise 정규화 및 [0, 1] 범위로 구성되었다. 약물-유전자 클러스터링의 경우 유전자(행)-약물(열) 테이블이 클러스터 테이블로 설정되었다. 그러나, SCI 세트에서 2회 이상 나타난 유전자만이 표에 포함되었다.To cluster the SCI sets according to drugs, drugs were first classified based on a common matched target protein or pathway according to the GDSC classification. To confirm the relationship between the SCI set and the cell lines of the MM group, hierarchical clustering analysis was performed on the tissue origins of drugs and cell lines. The complete linkage method and Euclidean distance were used for all hierarchical cluster analysis. The final clustering table consisted of a drug-wise normalization of the coefficient table and a range of [0, 1]. For drug-gene clustering, the gene (row)-drug (column) table was set as the cluster table. However, only genes that appeared more than once in the SCI set were included in the table.

5. TCGA 환자 데이터를 사용한 생존 분석5. Survival Analysis Using TCGA Patient Data

SCI 클러스터링에 대한 주요 결과에 기초하여, 환자 생존과 SCI 세트의 관계는 화학 요법 임상 TCGA 데이터로부터 BRAF/MAPK 억제제 약물(dabrafenib, sorafenib, trametinib, vemurafenib, selumetinib (AZD6244))로 치료받은 환자로 제한되었다. 총 80 명의 환자는 상기 5개의 BRAF/MAPK 억제제 약물 중 하나를 사용하여 화학 요법을 받았다. 이들 환자에 대한 체세포 돌연변이 데이터는 12개의 TCGA 암 프로젝트(ACC, COAD, GBM, KICH, KIRC, KIRP, LIHC, LGG, LUSC, SARC, SKCM, UCEC)로부터 다운로드되었고; 80명의 환자 중 65명의 데이터를 사용하였다. missense 돌연변이, nonsense 돌연변이, splice-site 돌연변이 및 번역 개시 부위 돌연변이는 손상된 돌연변이로 간주되었다. 화학 요법 임상 데이터 및 체세포 돌연변이 데이터 둘 다를 갖는 65명의 환자는 전술한 것과 동일한 방식으로 SCI에서의 BRAF와 그 결합된 파트너(Ps)의 돌연변이 프로파일에 따라 4개의 그룹으로 나누었다: WW, WMs, MWs, MM(여기서 B는 BRAF 유전자이고, Ms 및 Ws는 각각 돌연변이된 파트너 유전자 및 야생형의 임의의 유전자를 나타낸다.). 이 4개의 그룹에 대해 로그-랭크 테스트(log-rank test)를 적용하여 생존율의 차이를 확인하였다. 또한, 연령, 성별, 암종 (SKCM의 유무) 및 돌연변이 프로파일을 인자로 포함하는 일변량 및 다변량 콕스 비례 위험 모델을 수행하여 그룹 간의 생존 차이에 기여하는 주요 요인을 결정하였다. BRAF 및 GPR112 유전자에 대한 돌연변이 프로파일에 따라 4개의 그룹으로 분리된 pan-cancer분석에 포함된 환자에 대해 생존 분석을 수행하여, 두 유전자 모두 손상되었을 때(MM) 유의한 생존 차이가 있는지를 확인하였다. 이 분석을 위해 33개의 TCGA 암 프로젝트(ACC, BLCA, BRCA, CESC, CHOL, COAD, DLBC, ESCA, GBM, HNSC, KICH, KIRC, KIRP, LAML, LGG, LIHC, LUAD, LUSC, MESO, OV, PAAD, PCPG, PRAD, READ, SARC, SKCM, STAD, TGCT, THCA, THYM, UCEC, UCS, UVM)에서 3,781명의 환자를 포함하는 체세포 돌연변이 데이터를 다운로드하였다. missense 돌연변이, nonsense 돌연변이, splice-site 돌연변이 및 번역 개시 부위 돌연변이는 손상된 돌연변이로 간주되었다. 이들 환자는 BRAF 및 GPR112의 돌연변이 프로파일에 따라 WW, WM, MW 및 MM의 4 가지 그룹으로 분류되었다. 생존은 전술 한 바와 동일한 방식으로 분석되었다.Based on the key findings for SCI clustering, the relationship between patient survival and SCI set was limited to patients treated with BRAF/MAPK inhibitor drugs (dabrafenib, sorafenib, trametinib, vemurafenib, selumetinib (AZD6244)) from chemotherapy clinical TCGA data. . A total of 80 patients received chemotherapy with one of the above five BRAF/MAPK inhibitor drugs. Somatic mutation data for these patients were downloaded from 12 TCGA cancer projects (ACC, COAD, GBM, KICH, KIRC, KIRP, LIHC, LGG, LUSC, SARC, SKCM, UCEC); Data from 65 of 80 patients were used. Missense mutations, nonsense mutations, splice-site mutations and translation initiation site mutations were considered impaired mutations. 65 patients with both chemotherapy clinical data and somatic mutation data were divided into 4 groups according to the mutation profile of BRAF and its bound partner (Ps) in SCI in the same manner as described above: WW, WMs, MWs, MM (where B is the BRAF gene, and Ms and Ws represent the mutated partner gene and any gene of the wild type, respectively). The difference in survival rates was confirmed by applying a log-rank test to these four groups. In addition, univariate and multivariate Cox proportional hazards models including age, sex, carcinoma (with or without SKCM) and mutation profile as factors were performed to determine major factors contributing to differences in survival between groups. Survival analysis was performed on patients included in the pan-cancer analysis separated into four groups according to mutation profiles for the BRAF and GPR112 genes, and it was confirmed whether there was a significant difference in survival when both genes were damaged (MM). . For this analysis, 33 TCGA cancer projects (ACC, BLCA, BRCA, CESC, CHOL, COAD, DLBC, ESCA, GBM, HNSC, KICH, KIRC, KIRP, LAML, LGG, LIHC, LUAD, LUSC, MESO, OV, Somatic mutation data including 3,781 patients were downloaded from PAAD, PCPG, PRAD, READ, SARC, SKCM, STAD, TGCT, THCA, THYM, UCEC, UCS, UVM). Missense mutations, nonsense mutations, splice-site mutations and translation initiation site mutations were considered impaired mutations. These patients were classified into four groups: WW, WM, MW and MM according to the mutation profiles of BRAF and GPR112. Survival was analyzed in the same manner as previously described.

6. 통계 분석6. Statistical Analysis

약물 민감도 분석에서 MM 및 다른 그룹의 IC50값을 모델 P값이 MM과 비-MM 그룹간 비교를 위한 Student's t-test의 P값으로 정의되도록 FDR(False Discovery Rate) 보정으로 비교하기 위해 Student's t-test가 사용되었다. 이때 비-MM 그룹은 WW, MWs 및 WMs의 결합된 그룹이다. Drug-wise Benjamini-Hochberg 절차는 다중 시험 보정을 위해 모델 P값에 적용되었고, 조정 된 모델 P값은 Q값으로 정의되었다. 각 약물에 대해 Benjamini-Hochberg 다중 테스트 보정을 사용하여 MM 그룹과 비 MM 그룹 간의 비교에서 FDR을 추정하였고, MM그룹의 최대 IC50 값을 WW그룹의 IC50 중앙값과 비교하였다. Chi-squared test는 MM 그룹과 MWs 그룹 사이의 BRAF/ MAPK 억제제 유전자 돌연변이의 존재 또는 부재의 차이를 세포주 기원 비율와 비교하기 위해 사용되었다. Student's t-test 및 분산 분석(ANOVA)은 부담 효과와 관련하여 그룹을 비교하는 데 사용되었다. 생존 분석을 위해, R 패키지 TCGAbiolinks의 생존 분석 도구인 TCGAanalyze의 생존 기능을 사용하여 WW, WMs, MWs 및 MM 그룹 간의 환자 생존을 비교하였다. P<0.05는 모든 분석에서 유의한 차이를 나타내는 것으로 간주되었다. 대부분의 통계 분석은 R (버전 3.5.0) 및 Python (버전 3.7.2)에서 수행되었습니다. 요청 시 소스 코드를 사용할 수 있다. Student's t to compare IC 50 values of MM and other groups in drug sensitivity analysis with false discovery rate (FDR) correction such that model P values are defined as P values of Student's t-test for comparison between MM and non-MM groups. -test was used. Here, the non-MM group is a combined group of WW, MWs and WMs. The drug-wise Benjamini-Hochberg procedure was applied to the model P-values for multiple-trial calibration, and the adjusted model P-values were defined as the Q-values. Using the Benjamini-Hochberg correction for multiple testing on each drug were estimated FDR from the comparison between the group and non-MM MM Group, compared to the maximum value of the IC 50 and IC 50 MM Group Median WW group. The Chi-squared test was used to compare the difference in the presence or absence of BRAF/MAPK inhibitor gene mutations between the MM group and the MWs group with the percentage of cell line origin. Student's t-test and analysis of variance (ANOVA) were used to compare groups with respect to burden effects. For survival analysis, the survival function of TCGAanalyze, a survival analysis tool of R package TCGAbiolinks, was used to compare patient survival between WW, WMs, MWs and MM groups. P<0.05 was considered to indicate a significant difference in all analyses. Most of the statistical analysis was done in R (version 3.5.0) and Python (version 3.7.2). The source code is available upon request.

실험결과Experiment result

1. 암 세포주에서 후보 SCI 세트의 확인1. Identification of candidate SCI sets in cancer cell lines

SCI 세트(유전자 쌍-약물)는 모든 유전자 쌍에 대한 7,233,306번의 비교에 기초하여 확인되었다. 최종 SCI 세트의 기본 데이터 (평균, 표준 편차 (SD), 약물 당 유전자 쌍, 유전자 및 세포주의 최소값 및 최대 값)는 표 1에 나타내었다. 각 SCI 세트의 몇몇 유전자 쌍, 유전자 및 세포주는 약물에 따라 상당한 변화를 나타냈다. 필터링 후, 157개의 약물에 대해 1,580개의 중요한 후보 SCI 세트가 확인되었다. 비상업적 약물을 배제한 후 54개의 상용 약물에 대한 456개의 유전자를 포함하는 580개의 최종 SCI 세트를 얻었다.The SCI set (gene pair-drug) was identified based on 7,233,306 comparisons for all gene pairs. The basic data of the final SCI set (mean, standard deviation (SD), gene pairs per drug, minimum and maximum values of genes and cell lines) are shown in Table 1. Several gene pairs, genes and cell lines in each SCI set showed significant drug-dependent changes. After filtering, 1,580 significant candidate SCI sets were identified for 157 drugs. After excluding non-commercial drugs, a final set of 580 SCIs containing 456 genes for 54 commercial drugs was obtained.

Figure pat00001
Figure pat00001

2. 조직의 기원에 따른 군집 분석으로 식별된 후보 SCI 세트2. Set of candidate SCIs identified by cluster analysis by tissue origin

이들 후보 SCI 세트는 광범위한 유전자 및 약물이 포함되었다(54개의 약물에 대한 약물 당 평균 10.73개의 유전자 쌍). 약물-유전자 및 약물-조직 쌍에 의한 클러스터링 분석을 수행하여 이들 54개의 약물 및 456개의 유전자 중 공통 경로 또는 공유된 해부학적 부위를 확인하였다. 약물-유전자 클러스터링의 경우, 2개 이상의 손상 돌연변이가 있는 유전자만 포함하며(도 4), ERK/MAPK 억제제(dabrafenib, refametinib 및 trametinib)로 분류된 3가지 약물은 공유된 BRAF 관련 상승 상호 작용을 기반으로 함께 클러스터 되었다(도 5). GDSC 데이터베이스는 이러한 약물을 ERK/MAPK 억제제로 분류하지만 여기서는 보다 일반적인 BRAF/MAPK 억제제로 분류하였다. 14개의 유전자 쌍에서 BRAF를 포함하는 18개의 유전자가 이들 3가지 약물과의 상당한 상승적 상호 작용을 나타냈다. 표 2는 3가지 약물과 이들 쌍에 대해 MM 유전자형의 세포주의 빈도에 따라서 동정된 SCI 유전자 쌍을 나열한 것이다. 예상한 바와 같이, BRAF-돌연변이된 세포주는 WW 또는 WM(BRAF는 야생형 및 파트너 유전자는 돌연변이) 그룹의 것보다 IC50 값이 상당히 낮았다(도 5). 그러나, MM 세포주는 MW 군보다 IC50 값이 상당히 낮았다. dabrafenib에 이용한 IC50 데이터를 갖는 861개의 세포주 중에서 66개의 BRAF-돌연변이 된 세포주(7.67 %)가 존재 하였다. 유사하게, 933개의 세포주 중 72개 (7.72 %) 및 882개의 세포주 중 70개(7.94 %)는 각각 refametinib 및 trametinib 데이터에 대해 BRAF-돌연변이되었다. dabrafenib에 대해 동정된 9개의 유전자 쌍 중, 8개의 유전자가 BRAF를 갖는 SCI를 나타냈다: C10orf112, COL2A1, COL3A4, GPR112, NBEA, NLRP3, TTN 및 ZNF234. refametinib 에 대해 확인된 4개 쌍 중 3개는 CSMD1, LCE3C 및 NBEA를 갖는 BRAF를 포함하였고, trametinib에 대한 8개 쌍 중 6 개는 파트너로서 C10orf112, COL2A1, CSMD1, GPR112, NBEA, NLRP3 및 PLG를 갖는 BRAF와 관련되었다. 따라서 NBEA는 세 가지 약물 모두에 대한 BRAF의 공통 파트너 유전자로 확인되었다. C10orf112, COL2A1 및 GPR112는 dabrafenib 및 rametinib에 대한 반응에서 공통된 파트너였으며; CSMD1I는 efametinib 및 trametinib에 대해 나타났고; LCE3C, PLG, TTN 및 ZNF234는 특정 약물에 대해 한 번만 나타났다. dabrafenib, refametinib 및 trametinib에 대해 BRAF와 그 파트너의 MM 그룹을 포함하는 세포주는 각각 28, 37 및 28 개의 세포주였다. 이들 3가지 약물에 대해 비-BRAF 관련 SCI 세트를 갖는 3쌍의 유전자가 또한 존재하였는데, ABCA12-PDZD2 및 C7-USH2A는 BRAF 관련 유전자 쌍과 동일한 MM 세포주 중 일부를 공유하였다. 그렇지 않으면, LRRTM3-SCN1A 쌍은 BRAF-관련 유전자 쌍을 갖는 것들과 겹치지 않는 신규한 MM 세포주에서 발생하였다.These candidate SCI sets included a wide range of genes and drugs (average of 10.73 gene pairs per drug for 54 drugs). Clustering analysis by drug-gene and drug-tissue pairs was performed to identify common pathways or shared anatomical regions among these 54 drugs and 456 genes. For drug-gene clustering, only genes with two or more damaging mutations were included (Figure 4), and the three drugs classified as ERK/MAPK inhibitors (dabrafenib, refametinib and trametinib) were based on a shared BRAF-related synergistic interaction. were clustered together (Fig. 5). The GDSC database classifies these drugs as ERK/MAPK inhibitors, but here they are classified as more common BRAF/MAPK inhibitors. In 14 gene pairs, 18 genes, including BRAF, showed significant synergistic interactions with these three drugs. Table 2 lists the SCI gene pairs identified according to the frequency of cell lines of the MM genotype for the three drugs and these pairs. As expected, the BRAF-mutated cell lines had significantly lower IC 50 values than those of the WW or WM (BRAF wild-type and partner gene mutant) groups ( FIG. 5 ). However, the MM cell line had significantly lower IC 50 values than the MW group. Of the 861 cell lines with IC 50 data used for dabrafenib, there were 66 BRAF-mutated cell lines (7.67%). Similarly, 72 of 933 cell lines (7.72%) and 70 of 882 cell lines (7.94%) were BRAF-mutated for refametinib and trametinib data, respectively. Of the 9 gene pairs identified for dabrafenib, 8 genes exhibited SCI with BRAF: C10orf112, COL2A1, COL3A4, GPR112, NBEA, NLRP3, TTN and ZNF234. 3 of the 4 pairs identified for refametinib included BRAF with CSMD1, LCE3C and NBEA, and 6 of 8 pairs for trametinib had C10orf112, COL2A1, CSMD1, GPR112, NBEA, NLRP3 and PLG as partners. was associated with BRAF with Therefore, NBEA was identified as a common partner gene of BRAF for all three drugs. C10orf112, COL2A1 and GPR112 were common partners in response to dabrafenib and rametinib; CSMD1I has been shown for efametinib and trametinib; LCE3C, PLG, TTN and ZNF234 appeared only once for a particular drug. For dabrafenib, refametinib and trametinib, the cell lines containing the MM group of BRAF and its partners were 28, 37 and 28 cell lines, respectively. There were also three pairs of genes with non-BRAF-associated SCI sets for these three drugs, ABCA12-PDZD2 and C7-USH2A sharing some of the same MM cell lines as the BRAF-associated gene pair. Otherwise, LRRTM3-SCN1A pairs occurred in novel MM cell lines that did not overlap with those with BRAF-associated gene pairs.

SCI 세트의 조직 특이적 풍부화의 가능성을 탐구하기 위해 세포주의 조직 기원에 따라 약물의 클러스터링 분석을 수행하였다. GDSC 데이터베이스는 다른 수준의 해상도를 가진 두 가지 방식으로 기원 조직을 분류하였다. 조직 descriptor 1을 사용하여, 암 발생의 해부학적 위치에 따라 세포주의 19개 조직 기원이 있었고, 암의 특이적 진단 또는 병리학적 분류에 따른 55개의 기원이 존재하였다. 후자의 병리학적 분류를 사용하여, 흑색종 및 결장 직장암 세포주에서 주로 농축된 3 개의 BRAF/MAPK 억제제의 안정한 클러스터를 수득하였다(도 6). 총 GDSC 세포주와 BRAF/MAPK 억제제 관련 SCI 세트 농축 세포주간에 유의한 차이가 있었다(P <0.05). 전반적으로, 이들 결과는 BRAF/MAPK 억제제에 대한 SCI 세트를 갖는 세포주가 피부(59.2 %, 모든 흑색 종) 및 대장 (18.4 %, 모든 결장 직장암)으로부터 유래된 조직으로 현저하게 농축됨을 보여 주었다. 도 7A 및 7B의 파이 차트는 각각 총 990개의 세포주 및 49개의 MM 그룹 세포주에 대한 조직의 기원에 따라 BRAF/MAPK 억제제 클러스터에 따른 SCI 세트가 풍부한 세포주의 분포를 시각적으로 비교한 것이다. 총 55개의 세포주는 흑색종(5.56 %)으로 분류되었고 50개는 결장 직장암(5.05 %)으로 분류되었다.To explore the possibility of tissue-specific enrichment of the SCI set, a clustering analysis of drugs according to the tissue origin of the cell line was performed. The GDSC database classified tissue of origin in two ways with different levels of resolution. Using tissue descriptor 1, there were 19 tissue origins of cell lines according to anatomical location of cancer development, and 55 origins according to specific diagnosis or pathological classification of cancer. Using the latter pathologic classification, stable clusters of three BRAF/MAPK inhibitors were obtained, mainly concentrated in melanoma and colorectal cancer cell lines ( FIG. 6 ). There was a significant difference between the total GDSC cell line and the BRAF/MAPK inhibitor-related SCI set-enriched cell line (P <0.05). Overall, these results showed that cell lines with SCI sets for BRAF/MAPK inhibitors were significantly enriched in tissues derived from skin (59.2%, all melanomas) and colon (18.4%, all colorectal cancers). The pie charts in Figures 7A and 7B are a visual comparison of the distribution of cell lines rich in the SCI set according to the BRAF/MAPK inhibitor cluster according to tissue origin for a total of 990 cell lines and 49 MM group cell lines, respectively. A total of 55 cell lines were classified as melanoma (5.56%) and 50 as colorectal cancer (5.05%).

49개의 BRAF 관련 MM 그룹 세포주와 관련된 BRAF/MAPK 경로-표적화 약물의 열 지도는 도 8에 나타내었다.A heat map of BRAF/MAPK pathway-targeting drugs associated with 49 BRAF-related MM group cell lines is shown in FIG. 8 .

Figure pat00002
Figure pat00002

*각 이용 가능한 약물에 대한 IC50을 가진 세포주의 수*Number of cell lines with IC 50 for each available drug

3. BRAF / MAPK 억제제에 대한 BRAF 관련 SCI 세트와 파트너 유전자의 조합 효과3. Combination Effect of BRAF-Related SCI Set and Partner Genes on BRAF/MAPK Inhibitors

BRAF 관련 SCI 세트의 파트너 유전자 중 임의의 inter-genic 성분을 확인하기 위해, 각 약물 내 및 3개의 모든 BRAF/MAPK 억제제에 걸쳐 파트너 유전자를 조합하였다. 각각의 약물에 대한 4가지 그룹의 IC50 값의 비교 결과 및 분포는 도 9에 도시되어있다. 파트너의 결합 효과는 약물-특이적 (도 9A, 9C, 9E) 및 모든 약물 비교(MW 그룹 대 MM 그룹, P = 0.0016; WMs 대 MM 그룹, P = 0.0011)에서 유의하였다. 구체적으로, 3가지 약물 모두 MM 그룹보다 조합된 파트너 그룹의 돌연변이된 세포주에서 IC50 값이 현저히 낮았다. 약물 특이적 파트너 또는 복합 파트너 (MWs 그룹)의 평균 IC50 값은 WW 및 WMs 그룹의 평균 IC50 값보다 훨씬 작았다. 야생형 BRAF를 갖는 그룹(WW 또는 WM)간에 IC50 값에는 차이가 없었다. 또한, MM 그룹은 3가지 약물에 대한 두 조합에서 4가지 그룹 중에서 가장 낮은 IC50 값을 나타냈다. 또한, 각 3가지 약물에 대해 파트너 유전자간에 부가 효과가 있는지 평가하였다. 파트너 유전자에서 다수의 돌연변이를 갖는 세포주가 약물 효과에 보다 민감한 지 알아보기 위해, 그들의 MM 세포주를 파트너 유전자에서의 돌연변이 수로 나누고 그들의 IC50을 비교 하였다 (도 10). 파트너 유전자의 돌연변이 수는 1 내지 7의 범위였다. 각 약물에서 3개 이상의 파트너 유전자에 돌연변이가 있는 세포주가 거의 없기 때문에 통계적 유의성을 확인하기는 어려웠지만 IC50 값의 감소가 발견되었다. 이러한 부가 효과를 추가로 확인하기 위해, 파트너 유전자가 돌연변이된 세포주를 돌연변이 수에 따라 0 개, 1 개 및 2 개 이상의 3개 그룹으로 분할하여 통계적으로 유의한 차이가 있는지를 확인하였다(도 11). 3개의 BRAF/MAPK 억제제 특이적 및 조합된 파트너 유전자의 돌연변이의 수로 나눈 세포주의 IC50을 BRAF 야생 세포주의 IC50과 비교할 때, BRAF 돌연변이(MW) 및 BRAF 돌연변이는 물론 적어도 1개의 파트너 유전자 돌연변이된 그룹 (MM1)은 조합된 파트너와 비교해서 Dabrafenib(p 값 0.095)를 제외하고는 이전 분석에서와 같이 유의미한 차이를 나타냈다. (p 값 범위 <0.023) 그러나 하나의 파트너 유전자가 손상되고 (MM1) 두 개 이상이 손상되는 경우 (MM2 = <) Dabrafenib (p 값 0.034) 및 Trametinib (p 값 0.025)를 제외한 모든 조합된 파트너가 제외되었다. 약물 반응성에는 유의한 차이가 없었다.To identify any inter-genic components of the partner genes of the BRAF-related SCI set, partner genes were combined within each drug and across all three BRAF/MAPK inhibitors. Comparison results and distributions of IC 50 values of the four groups for each drug are shown in FIG. 9 . The binding effects of partners were significant in drug-specific ( FIGS. 9A, 9C, 9E ) and all drug comparisons (MW group versus MM group, P = 0.0016; WMs versus MM group, P = 0.0011). Specifically, all three drugs had significantly lower IC 50 values in the mutated cell line of the combined partner group than in the MM group. The average IC 50 value of drug-specific partner or partners compound (MWs group) is much smaller than the mean IC 50 value of the WW and WMs group. There was no difference in IC 50 values between groups with wild-type BRAF (WW or WM). In addition, the MM group showed the lowest IC 50 value among the four groups in both combinations for the three drugs. In addition, for each of the three drugs, it was evaluated whether there was an additive effect between the partner genes. To determine whether cell lines with multiple mutations in the partner gene are more sensitive to drug effects, their MM cell lines were divided by the number of mutations in the partner gene and their IC 50 was compared ( FIG. 10 ). The number of mutations in the partner gene ranged from 1 to 7. It was difficult to ascertain statistical significance because there are few cell lines with mutations in three or more partner genes in each drug, but a decrease in IC 50 values was found. In order to further confirm this additional effect, the cell line in which the partner gene is mutated was divided into 3 groups of 0, 1, and 2 or more according to the number of mutations, and it was confirmed whether there was a statistically significant difference (FIG. 11). . 3 BRAF / MAPK inhibitor as compared to specific and cell lines IC 50 of the divided by the number of mutations in the combination partner gene and IC 50 of the BRAF wild cell line, BRAF mutants (MW) and BRAF mutation, as well as the at least one partner gene mutation Group (MM1) showed significant differences as in the previous analysis, with the exception of Dabrafenib (p value 0.095) compared to the combined partner. (p value range <0.023) However, when one partner gene is impaired (MM1) and more than one partner gene is damaged (MM2 = <), all combined partners except Dabrafenib (p value 0.034) and Trametinib (p value 0.025) excluded. There was no significant difference in drug reactivity.

4. SCI 세트 및 모든 GDSC 세포주의 돌연변이 프로파일의 비교4. Comparison of mutation profiles of SCI sets and all GDSC cell lines

BRAF/MAPK 경로-표적화 약물 관련 SCI 세트가 SCI 특성으로부터의 돌연변이 프로파일의 기본 특성에 의해 또는 세포주의 조직 기원에 의해 영향을 받는지 확인하기 위해, BRAF 관련 세트의 MM 세포주와 모든 990 GDSC 세포주 사이의 돌연변이 빈도(LoF, missense, CNV 결실)를 비교하였다. 표 3에 나타낸 바와 같이, LoF 및 missense 돌연변이는 MM 세포주의 SCI 세트에서 BRAF를 갖는 파트너 유전자에 대해 상당히 더 빈번하였고 (P <0.001), CNV 결실 빈도는 더 높았지만 그 차이는 통계적으로는 유의하지않았다(P 값 <0.1). 그러나, 모든 유전자에 대한 3개의 돌연변이 프로파일을 고려할 때 모든 세포주에서는 유의한 차이는 없었다 (P> 0.1).To determine whether the BRAF/MAPK pathway-targeting drug-related SCI set is influenced by the underlying characteristics of the mutation profile from the SCI trait or by the tissue origin of the cell line, mutations between the MM cell line of the BRAF-related set and all 990 GDSC cell lines Frequency (LoF, missense, CNV deletion) was compared. As shown in Table 3, LoF and missense mutations were significantly more frequent (P < 0.001) for partner genes with BRAF in the SCI set of MM cell lines, and the frequency of CNV deletions was higher, but the difference was not statistically significant. did not (P value <0.1). However, there was no significant difference in all cell lines when considering the three mutation profiles for all genes (P > 0.1).

Figure pat00003
Figure pat00003

*Student's t-test*Student's t-test

5. TCGA 환자 데이터를 사용한 생존 분석5. Survival Analysis Using TCGA Patient Data

BRAF-선택적 억제제, MEK 억제제 또는 이용 가능한 체세포 돌연변이 프로파일을 갖는 RAF 억제제로 치료된 pan-cancer TCGA 분석에 포함된 65명의 환자 중에서 GDSC 데이터 분석에서 파생된 모든 파트너 유전자를 결합했을 때 30명은 WW 그룹, 22명은 WMs 그룹에 있었으며, 2명은 MWs 그룹, 11명은 MM 그룹이었다(도 12). 생존 분석 결과 MM그룹의 환자는 WW 그룹(64.10 vs 27.13 개월; 위험 비 (HR) = 0.44, P = 0.101) 및 MW 그룹 (64.10 vs 19.15 개월; HR = 0.096, P = 0.007)과 비교하여 전체 평균 생존 (OS)이 더 긴 것으로 나타났다. BRAF/MAPK 억제제의 사용과 유전자 돌연변이 대한 환자 수 표는 표 4 내지 표 7에 나타내었다. 각 인자에 대한 일변량 콕스 회귀는 생존에 있어서, 연령, 성별 또는 암종 유형의 유의한 영향을 나타내지 않는 반면, 돌연변이 유형은 영향을 미쳤다. 다변량 콕스 회귀 분석은 돌연변이 유형만이 생존의 유의한 독립적 예측 인자임을 확인하였다 (P = 0.0093).Among 65 patients included in the pan-cancer TCGA analysis treated with a BRAF-selective inhibitor, MEK inhibitor or RAF inhibitor with an available somatic mutation profile, when all partner genes derived from GDSC data analysis were combined, 30 were in the WW group, 22 were in the WMs group, 2 were in the MWs group, and 11 were in the MM group ( FIG. 12 ). As a result of survival analysis, patients in the MM group had an overall mean compared to the WW group (64.10 vs 27.13 months; hazard ratio (HR) = 0.44, P = 0.101) and the MW group (64.10 vs 19.15 months; HR = 0.096, P = 0.007). Survival (OS) was found to be longer. Tables 4 to 7 show the number of patients using BRAF/MAPK inhibitors and gene mutations. Univariate Cox regression for each factor showed no significant effect of age, sex or carcinoma type on survival, whereas mutation type did. Multivariate Cox regression analysis confirmed that only mutation type was a significant independent predictor of survival (P = 0.0093).

Figure pat00004
Figure pat00004

Figure pat00005
Figure pat00005

Figure pat00006
Figure pat00006

Figure pat00007
Figure pat00007

6. 저항성 유전자에서 돌연변이 프로파일의 비교6. Comparison of Mutation Profiles in Resistance Genes

BRAF/MAPK 억제제에 대한 치료 반응성에 대한 이전의 연구는 주로 약물 내성과 관련된 돌연변이 프로파일의 존재에 초점을 두었다. 확인된 유전자 프로파일의 시너지 민감도가 이전의 BRAF 억제제 저항과 관련된 유전자의 돌연변이의 2차 결과가 아니라는 것을 확인하기 위해, BRAF 증폭 및 MAPK 계열 유전자의 돌연변이(PTEN, RAC1, CDK4, AKT1, NF1 및 NRAS) 등 잘 알려진 저항 유전자의 돌연변이만 비교하였다. GDSC 데이터베이스에서, 936명의 환자 중 194개의 세포주 (20.6 %)는 적어도 하나의 저항 변화를 가졌다. TCGA 데이터베이스에서 분석한 62명의 환자 중 15명 (23.1 %)은 저항 관련 변화 중 적어도 하나를 가지고 있었다. GDSC 및 TCGA 데이터에서 4그룹 (WW, WMs, MWs, MM) 사이에서 저항 변화 가능성이 있는 환자의 비율에는 유의한 차이가 없었다(표 4 내지 표 7). 또한, chi-squared 테스트는 TCGA 및 GDSC 세포주 모두에 대해 MM 그룹과 MW 그룹 사이에 잘 알려진 BRAF/MAPK 억제제 내성 유전자 돌연변이의 존재 또는 부재에서 유의미한 차이를 나타내지 않았다 (P = 1).Previous studies of therapeutic responsiveness to BRAF/MAPK inhibitors have focused primarily on the existence of mutational profiles associated with drug resistance. To confirm that the synergistic sensitivity of the identified gene profiles is not a secondary consequence of mutations in genes associated with previous BRAF inhibitor resistance, BRAF amplification and mutations in MAPK family genes (PTEN, RAC1, CDK4, AKT1, NF1 and NRAS) Only mutations of well-known resistance genes, such as eg, were compared. In the GDSC database, 194 cell lines (20.6%) of 936 patients had at least one change in resistance. Of the 62 patients analyzed in the TCGA database, 15 (23.1%) had at least one resistance-related change. In the GDSC and TCGA data, there was no significant difference in the proportion of patients with potential change in resistance between the 4 groups (WW, WMs, MWs, MM) (Tables 4 to 7). In addition, the chi-squared test showed no significant difference in the presence or absence of well-known BRAF/MAPK inhibitor resistance gene mutations between the MM and MW groups for both TCGA and GDSC cell lines (P = 1).

7. GDSC 데이터베이스에서 후보 SCI 파트너의 발현 프로파일 비교7. Comparison of Expression Profiles of Candidate SCI Partners in the GDSC Database

가장 큰 기여도를 가진 BRAF 관련 SCI 세트의 파트너 유전자를 식별하고 GDSC 세포주에서 모든 후보 파트너 유전자의 발현 프로파일을 비교하였다. BRAF V600E 돌연변이를 갖는 세포주 중에서, 11개 파트너 유전자 중 하나 이상에서 동시에 돌연변이를 수반하는 것들이 MM 그룹으로 그룹화되고 BRAF 돌연변이만을 포함하는 것들이 MWs 그룹으로 그룹화되었다. 이들 중에서, GPR112 (ADGR4)만이 MW 세포주보다 MM에서 유의하게 더 낮은 발현 수준을 나타냈다(P = 0.047) (도 13).The partner genes of the BRAF-related SCI set with the greatest contribution were identified and the expression profiles of all candidate partner genes in the GDSC cell line were compared. Among the cell lines carrying the BRAF V600E mutation, those carrying simultaneous mutations in one or more of the 11 partner genes were grouped into the MM group and those containing only the BRAF mutation were grouped into the MWs group. Of these, only GPR112 (ADGR4) showed a significantly lower expression level in MM than in the MW cell line (P = 0.047) ( FIG. 13 ).

BRAF와 GPR112 사이에 숨겨진 상호 작용 효과가 있는지 평가하기 위해, TCGA 데이터베이스에서 BRAF와 GPR112 둘 다에 대한 돌연변이 프로파일을 가진 환자를 포함시켰다. 생존 분석을 위해 BRAF와 GPR112의 공존에 따라 총 3,770명의 환자를 4개의 그룹으로 나누었다. MM그룹의 환자는 WW그룹 환자에 비해 OS 중앙값이 더 길었다 (35.70 vs 24.67 개월; HR = 0.37, P = 0.009). 그리고, BRAF 돌연변이가 있지만 야생 GPR112인 MW그룹에 비해서도 OS 중앙값이 더 길었다(35.70 vs 31.85 개월; HR=0.45, P=0.050). 단변량 및 다변량 콕스 회귀 분석에서, 연령, 성별 및 돌연변이 프로파일은 모두 생존에 영향을 미쳤지만 (P <0.05), 암종 유형은 그렇지 않았다 (P> 0.05). 환자의 생존에 대한 성별의 영향으로 성별에 따라 계층화된 생존 분석을 수행하였다. 남성 (n = 1,482)과 여성 (n = 2,288) 모두 MM그룹의 환자는 WW 그룹의 환자에 비해 OS가 더 긴 평균값을 가졌다 (남성: 40.97 vs 21.40 개월, HR = 0.33, P = 0.026; 여성: 27.17 대 26.97 개월, HR = 0.42, P = 0.131) 및 MW 그룹 (남성: 40.97 대 33.4 개월, HR = 0.40, P = 0.084; 여성: 27.17 대 31.33 개월, HR = 0.54, P = 0.327). 단변량 및 다변량 콕스 회귀 분석 모두 나이가 생존에 크게 영향을 미치는 반면 암종 유형과 돌연변이 프로파일은 남성과 여성 모두에게 영향을 미치지 않았다 (도 14). 따라서 성별-특이적 생존 분석은 모든 환자 분석과 다르지 않았다. 암 유형과 BRAF/MAPK 억제제 사용 상태는 남녀간에 다른 분포를 나타냈다. 상이한 암 유형을 가진 환자와 BRAF/MAPK 억제제 약물에 대한 성별-특이적 분포는 각각 도 15A 및 15B에 나타내었다.To assess whether there is a hidden interaction effect between BRAF and GPR112, we included patients with mutation profiles for both BRAF and GPR112 in the TCGA database. For survival analysis, a total of 3,770 patients were divided into 4 groups according to the coexistence of BRAF and GPR112. Patients in the MM group had a longer median OS than those in the WW group (35.70 vs 24.67 months; HR = 0.37, P = 0.009). And, the median OS was longer than that of the MW group with BRAF mutation but wild GPR112 (35.70 vs 31.85 months; HR=0.45, P=0.050). In univariate and multivariate Cox regression analysis, age, sex, and mutation profile all affected survival (P < 0.05), but not carcinoma type (P > 0.05). A stratified survival analysis was performed according to gender due to the effect of gender on patient survival. For both males (n = 1,482) and females (n = 2,288), patients in the MM group had a longer mean OS than those in the WW group (male: 40.97 vs 21.40 months, HR = 0.33, P = 0.026; female: 27.17 versus 26.97 months, HR = 0.42, P = 0.131) and MW group (male: 40.97 versus 33.4 months, HR = 0.40, P = 0.084; female: 27.17 versus 31.33 months, HR = 0.54, P = 0.327). Both univariate and multivariate Cox regression analyzes showed that age significantly affected survival, whereas carcinoma type and mutation profile did not affect both males and females (Figure 14). Therefore, the gender-specific survival analysis was not different from the analysis of all patients. Cancer types and status of BRAF/MAPK inhibitor use showed different distributions between men and women. Gender-specific distributions for patients with different cancer types and BRAF/MAPK inhibitor drugs are shown in Figures 15A and 15B, respectively.

Claims (6)

복수개의 암세포 중 소정 개수 이상의 세포에서 변이가 있는 유전자를 선별하는 제1 단계;
상기 선별된 유전자를 2개씩 쌍을 지어 상기 세포들을 각 유전자 쌍의 유전자형 별로 WW, WM, MW 또는 MM(W는 야생형, M은 변이 유전자)으로 나누는 제2 단계;
상기 나눠진 세포들에 항암제를 처리하고 MM 유전자형 세포의 항암제 반응성을 다른 유전자형 세포들과 각각 비교하여, MM 유전자형 세포의 항암제 반응성이 다른 3개 유전자형 세포의 항암제 반응성 보다 큰 유전자 쌍을 선별하는 제3 단계; 및
상기 선별된 유전자 쌍 중 1) MM 유전자형 세포 그룹에서 항암제 반응성이 최소인 세포가 WW 유전자형 세포 그룹에서 항암제 반응성이 중간인 세포보다 항암제 반응성이 더 크거나, 2) MM 유전자형 세포 그룹의 항암제 반응성의 평균값이 4개 유전자형 세포 그룹 중 가장 큰 유전자 쌍을 선별하는 제4 단계;를 포함하는, 상호 협력적 암 치료제 반응 유전자 쌍을 선별하는 방법.
A first step of selecting a gene with a mutation in a predetermined number or more of the plurality of cancer cells;
a second step of pairing the selected genes two by two and dividing the cells into WW, WM, MW or MM (W is wild type, M is a mutant gene) for each genotype of each gene pair;
Treatment of the divided cells with an anticancer agent and comparing the anticancer drug reactivity of the MM genotype cells with other genotype cells, respectively, a third step of selecting a gene pair in which the anticancer drug reactivity of the MM genotype cells is greater than the anticancer drug reactivity of the other three genotype cells ; and
Among the selected gene pairs, 1) the cell with the least anticancer drug reactivity in the MM genotype cell group had a greater anticancer drug reactivity than the cells with the medium anticancer drug reactivity in the WW genotype cell group, or 2) the average value of the anticancer drug reactivity of the MM genotype cell group A method for selecting a cooperative cancer treatment response gene pair, comprising a; a fourth step of selecting the largest gene pair from among the four genotype cell groups.
청구항 1에 있어서, 상기 변이는 기능상실변이(Loss of Funtion(LoF) mutations), 과오 돌연변이(missense mutations) 및 복제수 변이(Copy Number Variation(CNV)) 중 적어도 하나의 변이를 포함하는, 방법.
The method of claim 1 , wherein the mutation comprises at least one mutation of loss of function (LoF) mutations, missense mutations, and copy number variation (CNV).
청구항 2에 있어서, 상기 복제수 변이는 동형 접합 결실(deletion)인, 방법.
The method of claim 2 , wherein the copy number variation is a homozygous deletion.
청구항 1에 있어서, 상기 소정 개수는 5개인, 방법.
The method of claim 1 , wherein the predetermined number is five.
청구항 1에 있어서, 상기 제3 단계에서 MM 유전자형 세포 그룹의 항암제 반응성의 평균값을 다른 유전자형 세포 그룹의 항암제 반응성의 평균값과 각각 비교하는, 방법.
The method according to claim 1, wherein in the third step, the average value of the anticancer drug reactivity of the MM genotype cell group is compared with the average value of the anticancer drug reactivity of other genotype cell groups, respectively.
청구항 1에 있어서, 상기 제3 및 제4 단계에서 항암제 반응성의 비교는 IC50 값을 비교하는 것인, 방법.The method according to claim 1, wherein the comparison of anticancer drug reactivity in the third and fourth steps is to compare IC 50 values.
KR1020190175697A 2019-12-26 2019-12-26 Method for screening synergistic chemo-therapeutic interaction predicting pair of genes for anticancer agents KR20210083080A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190175697A KR20210083080A (en) 2019-12-26 2019-12-26 Method for screening synergistic chemo-therapeutic interaction predicting pair of genes for anticancer agents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190175697A KR20210083080A (en) 2019-12-26 2019-12-26 Method for screening synergistic chemo-therapeutic interaction predicting pair of genes for anticancer agents

Publications (1)

Publication Number Publication Date
KR20210083080A true KR20210083080A (en) 2021-07-06

Family

ID=76860956

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190175697A KR20210083080A (en) 2019-12-26 2019-12-26 Method for screening synergistic chemo-therapeutic interaction predicting pair of genes for anticancer agents

Country Status (1)

Country Link
KR (1) KR20210083080A (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101524562B1 (en) 2013-08-19 2015-06-02 서울대학교산학협력단 Method and system for personalized prevention of adverse drug reaction based on information of individual deleterious protein sequence variation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101524562B1 (en) 2013-08-19 2015-06-02 서울대학교산학협력단 Method and system for personalized prevention of adverse drug reaction based on information of individual deleterious protein sequence variation

Similar Documents

Publication Publication Date Title
JP6854792B2 (en) Pathway Recognition Algorithm Using Data Integration for Genome Models (PARADIGM)
Morrow et al. Functional interactors of three genome-wide association study genes are differentially expressed in severe chronic obstructive pulmonary disease lung tissue
Shahamatdar et al. Germline features associated with immune infiltration in solid tumors
Liu et al. Amino acid metabolism‐related gene expression‐based risk signature can better predict overall survival for glioma
US20220130549A1 (en) Tumor classification based on predicted tumor mutational burden
CN108504555B (en) Device and method for identifying and evaluating tumor progression
Alkallas et al. Multi-omic analysis reveals significantly mutated genes and DDX3X as a sex-specific tumor suppressor in cutaneous melanoma
Deng et al. Prioritizing natural-selection signals from the deep-sequencing genomic data suggests multi-variant adaptation in Tibetan highlanders
Akter et al. GenomeForest: An ensemble machine learning classifier for endometriosis
C. Silva et al. Cross-tissue analysis of blood and brain epigenome-wide association studies in Alzheimer’s disease
Dai et al. Identification of hub methylated‐CpG sites and associated genes in oral squamous cell carcinoma
Brossard et al. Integrated pathway and epistasis analysis reveals interactive effect of genetic variants at TERF1 and AFAP1L2 loci on melanoma risk
Willis et al. Genome-wide analysis of the role of copy-number variation in pancreatic cancer risk
Zhang et al. Hallmark guided identification and characterization of a novel immune-relevant signature for prognostication of recurrence in stage I–III lung adenocarcinoma
Tu et al. Transcriptional patterns of lower-grade glioma patients with distinct ferroptosis levels, immunotherapy response, and temozolomide sensitivity
Bainer et al. A p53-regulated apoptotic gene signature predicts treatment response and outcome in pediatric acute lymphoblastic leukemia
KR20210083080A (en) Method for screening synergistic chemo-therapeutic interaction predicting pair of genes for anticancer agents
Ye et al. Correlation analysis of m6A-modified regulators with immune microenvironment infiltrating cells in lung adenocarcinoma
Zhang et al. Genetic variation in C12orf51 is associated with prognosis of intestinal-type gastric cancer in a Chinese population
Yu et al. Mutational profiling of myeloid neoplasms associated genes may aid the diagnosis of acute myeloid leukemia with myelodysplasia-related changes
Lee et al. Meta-analysis of single-cell RNA-sequencing data for depicting the transcriptomic landscape of chronic obstructive pulmonary disease
Xiao et al. Characterization of the immune related lncRNAs in bladder cancer to aid immunotherapy
Liu et al. Cuprotosis patterns are associated with tumor mutation burden and immune landscape in lung adenocarcinoma
Pishva et al. Genome‐wide DNA methylation analysis of aggressive behaviour: a longitudinal population‐based study
Ren et al. Multiomics Profiling and Clustering of Low-Grade Gliomas Based on the Integrated Stress Status

Legal Events

Date Code Title Description
E601 Decision to refuse application