JPWO2021257729A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2021257729A5
JPWO2021257729A5 JP2022566136A JP2022566136A JPWO2021257729A5 JP WO2021257729 A5 JPWO2021257729 A5 JP WO2021257729A5 JP 2022566136 A JP2022566136 A JP 2022566136A JP 2022566136 A JP2022566136 A JP 2022566136A JP WO2021257729 A5 JPWO2021257729 A5 JP WO2021257729A5
Authority
JP
Japan
Prior art keywords
cancer
genes
molecules
cfrna
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022566136A
Other languages
Japanese (ja)
Other versions
JP2023534094A (en
Publication date
Application filed filed Critical
Priority claimed from PCT/US2021/037668 external-priority patent/WO2021257729A2/en
Publication of JP2023534094A publication Critical patent/JP2023534094A/en
Publication of JPWO2021257729A5 publication Critical patent/JPWO2021257729A5/ja
Pending legal-status Critical Current

Links

Images

Description

関連出願の相互参照Cross-reference to related applications

本出願は、2020年6月16日に出願された米国仮出願第63/039,886号の利益を主張し、当該出願はすべての目的のためにその全体が参照により本明細書に組み込まれる。 This application claims the benefit of U.S. Provisional Application No. 63/039,886, filed June 16, 2020, which is incorporated herein by reference in its entirety for all purposes. .

2017年の時点で、米国では毎年合計160万人を超える新たな症例が発生しており、癌は世界的に顕著な公衆衛生上の問題となっている。Siegel et al., 2017年, “Cancer statistics,” CA Cancer J Clin. 67(1):7-30頁を参照。スクリーニングプログラムと早期診断は、癌患者の無病生存期間の改善と死亡率の低下に重要な影響を与える。早期診断のための非侵襲的アプローチは患者のコンプライアンスを促進するため、スクリーニングプログラムに含めることができる。 As of 2017, with a total of over 1.6 million new cases occurring each year in the United States, cancer has become a prominent public health problem worldwide. Siegel et al. , 2017, "Cancer statistics," CA Cancer J Clin. 67(1):7-30. Screening programs and early diagnosis have a significant impact on improving disease-free survival and reducing mortality in cancer patients. Noninvasive approaches for early diagnosis promote patient compliance and can be included in screening programs.

無細胞核酸(cfNA)は、血清、血漿、尿、およびその他の体液に含まれ(Chanら、“Clinical Sciences Reviews Committee of the Association of Clinical Biochemists Cell-free nucleic acids in plasma, serum and urine:a new tool in molecular diagnosis,” Ann Clin Biochem. 2003年;40(Pt 2):122-130頁)、「リキッドバイオプシー(液体生検)」と呼ばれ、特定の疾患の循環像を示す。De Mattos-Arruda and Caldas, 2016年, “Cell-free circulating tumour DNA as a liquid biopsy in breast cancer,” Mol Oncol. 2016年;10(3):464-474頁を参照されたい。同様に、無細胞RNAは癌検出のための分析対象として提案されている。Tzimagiorgisら、“Recovering circulating extracellular or cell-free RNA from bodily fluids,” Cancer Epidemiology 2011年;35(6):580-589頁を参照されたい。これらのアプローチは、癌などのさまざまな疾患をスクリーニングする非侵襲的な方法の可能性を示している。 Cell-free nucleic acids (cfNA) are found in serum, plasma, urine, and other body fluids (Chan et al., "Clinical Sciences Reviews Committee of the Association of Clinical Biochemists Cell-free nucleic acids in plasma, ser um and urine: a new tool in molecular diagnosis," Ann Clin Biochem. 2003;40(Pt 2):122-130), called "liquid biopsy", which presents a circulatory picture of a particular disease. De Mattos-Arruda and Caldas, 2016, "Cell-free circulating tumor DNA as a liquid biopsy in breast cancer," Mol Oncol. 2016;10(3):464-474. Similarly, cell-free RNA has been proposed as an analyte for cancer detection. See Tzimagiorgis et al., "Recovering circulating extracellular or cell-free RNA from bodily fluids," Cancer Epidemiology 2011;35(6):580-589. These approaches demonstrate the potential for non-invasive methods of screening for various diseases such as cancer.

それにもかかわらず、癌は依然として世界中で頻繁に死因となっている。過去数十年にわたって、処置の選択肢は改善されたが、生存率は低いままである。外科的切除および薬物ベースのアプローチによる処置の成功は、初期段階の腫瘍の同定に大きく依存している。しかし、イメージングやバイオマーカーベースのアプローチなどの現在の技術では、疾患がより進行した段階に入るまで腫瘍を特定できないことがよくある。 Nonetheless, cancer remains a frequent cause of death worldwide. Over the past few decades, treatment options have improved, but survival rates remain low. Successful treatment by surgical resection and drug-based approaches is highly dependent on early stage tumor identification. However, current techniques such as imaging and biomarker-based approaches often fail to identify tumors until the disease has entered more advanced stages.

したがって、治療的介入が成功する可能性が高い初期段階で疾患を特定できる、新しい非侵襲的検出モダリティが依然として必要とされている。 Therefore, there remains a need for new non-invasive detection modalities that can identify disease at an early stage when therapeutic intervention is likely to be successful.

さまざまな実施形態によれば、本明細書で開示される主題は、サンプル中の複数の標的無細胞RNA(cfRNA)分子を測定する方法を提供する。実施形態において、前記方法は、(a)前記複数の標的cfRNA分子またはそのcDNA分子を濃縮して、ポリヌクレオチドの濃縮サンプルを生成すること;および/または(b)前記濃縮サンプルの前記ポリヌクレオチドまたはその増幅産物をシーケンシングすること;を含み、前記複数の標的cfRNA分子は、表11の1つ以上の転写産物から選択され得る。実施形態において、前記複数の標的cfRNA分子が、表8および表12~15のうちの1つ以上、またはそれらの任意の組み合わせ(例えば、表8および表11~14のうちの1つ以上に記載された5、10、15または20個の遺伝子の転写産物)から選択され得る。 According to various embodiments, the presently disclosed subject matter provides methods of measuring multiple target cell-free RNA (cfRNA) molecules in a sample. In embodiments, the method comprises (a) enriching the plurality of target cfRNA molecules or cDNA molecules thereof to produce an enriched sample of polynucleotides; and/or (b) the polynucleotides or and said plurality of target cfRNA molecules may be selected from one or more transcripts of Table 11. In embodiments, the plurality of target cfRNA molecules are listed in one or more of Table 8 and Tables 12-15, or any combination thereof (e.g., one or more of Table 8 and Tables 11-14). transcripts of 5, 10, 15 or 20 genes selected).

いくつかの態様において、本開示は、対象における癌を検出する方法を提供する。実施形態において、前記方法は、(a)前記対象のサンプル中の複数の標的無細胞RNA(cfRNA)分子を測定することであって、前記複数の標的cfRNA分子は表11の転写産物から選択される、測定すること;および/または(b)閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することを含む、前記癌を検出すること;を含む。実施形態において、閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することが、(i)検出、(ii)バックグラウンドを超える検出、および/または(iii)前記状態を有さない対象における対応する配列リードのレベルよりも高いレベルでの検出を含む。実施形態において、前記複数の標的cfRNA分子が、表8および表12~15のうちの1つ以上(例えば、表8および表11~14のうちの1つ以上に記載された5、10、15または20個の遺伝子の転写産物)から選択される。 In some aspects, the disclosure provides methods of detecting cancer in a subject. In embodiments, the method comprises (a) measuring a plurality of target cell-free RNA (cfRNA) molecules in a sample of said subject, wherein said plurality of target cfRNA molecules are selected from the transcripts of Table 11. and/or (b) detecting said cancer comprising detecting one or more of said target cfRNA molecules above a threshold level. In embodiments, detecting one or more of said target cfRNA molecules above a threshold level comprises (i) detection, (ii) detection above background, and/or (iii) in a subject not having said condition Including detection at a level higher than that of the corresponding sequence read. In embodiments, the plurality of target cfRNA molecules are selected from one or more of Tables 8 and 12-15 (eg, 5, 10, 15 listed in Table 8 and one or more of Tables 11-14). or transcripts of 20 genes).

さまざまな態様において、本開示は、対象の疾患状態を検出するための方法および組成物を提供する。実施形態において、前記方法は、無細胞リボ核酸(cfRNA)中の1つ以上のマーカーを検出することを含む。実施形態において、cfRNAを検出することは、対象由来の生物学的サンプルからのcfRNAをシーケンシングしてcfRNAリードを生成することを含む。実施形態において、前記方法は、対象の細胞からのRNAをシーケンシングして細胞リードを生成することと、前記cfRNAリードをフィルタリングして、1つ以上の細胞リードに対応するcfRNAリードを除外することをさらに含む。実施形態において、前記細胞は血液細胞である。実施形態において、前記方法は、前記cfRNAリードをフィルタリングして、1つ以上のリボソーム、ミトコンドリアおよび/または血液関連転写産物を除外することを含む。実施形態において、エクソン-エクソン接合部にオーバーラップするcfRNAリード(またはリードペア)のみが測定される。実施形態において、1つ以上のマーカー(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、またはそれ以上のマーカー)に対応するcfRNAが測定される。前記1つ以上のマーカーは、本明細書に開示されるいずれかのマーカーの任意の組み合わせであり得る。実施形態において、前記1つ以上のマーカーは前記疾患状態に関連する。実施形態において、本方法は、対象の前記疾患状態を処置することを含む。 In various aspects, the present disclosure provides methods and compositions for detecting disease states in a subject. In embodiments, the method comprises detecting one or more markers in cell-free ribonucleic acid (cfRNA). In embodiments, detecting cfRNA comprises sequencing cfRNA from a biological sample from the subject to generate cfRNA reads. In embodiments, the method comprises sequencing RNA from cells of a subject to generate cellular reads and filtering the cfRNA reads to exclude cfRNA reads corresponding to one or more cellular reads. further includes In embodiments, said cells are blood cells. In embodiments, said method comprises filtering said cfRNA reads to exclude one or more ribosomal, mitochondrial and/or blood related transcripts. In embodiments, only cfRNA reads (or read pairs) that overlap exon-exon junctions are measured. In embodiments, one or more markers (e.g., 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, or more cfRNA corresponding to (marker) is measured. The one or more markers can be any combination of any of the markers disclosed herein. In embodiments, said one or more markers are associated with said disease state. In embodiments, the method comprises treating said disease state in a subject.

本開示の態様は、対象における疾患状態を検出する方法を含み、前記方法は、前記対象から複数の無細胞リボ核酸(cfRNA)分子を含む生物学的試験サンプルを単離すること;前記生物学的試験サンプルから前記複数のcfRNA分子を抽出すること;前記抽出されたcfRNA分子に対してシーケンシング手順を実行して、複数の配列リードを生成すること;フィルタリング手順を実行して、1つ以上の健常細胞に由来する配列リードの除外集団と、配列リードの非除外集団とを生成すること;前記非除外配列リードに対して定量化手順を実行すること;および前記定量化手順が閾値を超える値を生成した場合に、前記対象における前記疾患状態を検出することを含む。実施形態において、閾値を超える1つ以上の非除外配列リードを検出することは、(i)検出、(ii)バックグラウンドを超える検出、または(iii)前記状態を有さない対象における対応する配列リードのレベルよりも高いレベルでの検出、を含む。 Aspects of the present disclosure include a method of detecting a disease state in a subject, said method comprising isolating from said subject a biological test sample comprising a plurality of cell-free ribonucleic acid (cfRNA) molecules; extracting the plurality of cfRNA molecules from a target test sample; performing a sequencing procedure on the extracted cfRNA molecules to generate a plurality of sequence reads; performing a filtering procedure to generate one or more generating an excluded population of sequence reads derived from healthy cells and a non-excluded population of sequence reads; performing a quantification procedure on said non-excluded sequence reads; and said quantification procedure exceeds a threshold Detecting the disease state in the subject when generating a value. In embodiments, detecting one or more non-excluded sequence reads above a threshold is defined as (i) detection, (ii) detection above background, or (iii) corresponding sequence in subjects without said condition. detection at levels higher than the level of leads.

開示される主題の態様は、疾患状態を示す1つ以上のRNA配列を同定するためのコンピュータ実装方法をさらに含み、前記方法は、コンピュータシステムによって、前記疾患を有することが知られている対象から得られた第1の試験サンプルから複数のRNA分子からの配列リードの第1セットを取得することであって、前記第1の試験サンプルは複数の無細胞RNA(cfRNA)分子を含む、取得すること;コンピュータシステムによって、対照サンプルから複数のRNA分子からの配列リードの第2セットを取得すること;およびコンピュータシステムによって、前記配列リードの第1セットに存在し、前記配列リードの第2セットには存在しない1つ以上のRNA配列を検出して、前記疾患状態を示す1つ以上のRNA配列を同定すること;を含む。 Aspects of the disclosed subject matter further include a computer-implemented method for identifying one or more RNA sequences indicative of a disease state, wherein the method is performed by a computer system from a subject known to have the disease. obtaining a first set of sequence reads from a plurality of RNA molecules from a first test sample obtained, the first test sample comprising a plurality of cell-free RNA (cfRNA) molecules; obtaining, by a computer system, a second set of sequence reads from a plurality of RNA molecules from a control sample; detecting one or more RNA sequences that are absent to identify one or more RNA sequences indicative of said disease state.

他の態様において、前記主題は、対象における1つ以上の腫瘍由来RNA分子を検出するためのコンピュータ実装方法に関し、前記方法は、コンピュータシステムによって、腫瘍を有することが知られている、または腫瘍を有すると疑われる対象からの第1の試験サンプルから複数のRNA分子からの配列リードの第1セットを取得することであって、前記第1の試験サンプルは複数の無細胞RNA(cfRNA)分子を含む、取得すること;コンピュータシステムによって、前記対象からの複数の血液細胞から複数のRNA分子からの配列リードの第2セットを取得すること;およびコンピュータシステムによって、前記配列リードの第1セットに存在し、前記配列リードの第2セットには存在しない1つ以上のRNA配列を検出して、前記対象における前記1つ以上の腫瘍由来RNA分子を検出すること;を含む。 In another aspect, the subject matter relates to a computer-implemented method for detecting one or more tumor-derived RNA molecules in a subject, wherein the method comprises, by a computer system, a tumor known to have or a tumor. obtaining a first set of sequence reads from a plurality of RNA molecules from a first test sample from a subject suspected of having a subject, said first test sample comprising a plurality of cell-free RNA (cfRNA) molecules; obtaining, by a computer system, a second set of sequence reads from a plurality of RNA molecules from a plurality of blood cells from said subject; and, by a computer system, the sequence reads present in said first set of sequence reads and detecting one or more RNA sequences not present in the second set of sequence reads to detect the one or more tumor-derived RNA molecules in the subject.

いくつかの態様において、開示される主題は、癌を有することが知られている、または癌を有すると疑われる対象において、癌の存在を検出する、癌のステージを決定する、癌の進行を監視する、および/または癌の種類もしくは癌のサブタイプを決定する方法に関し、前記方法は、(a)前記対象から、複数の無細胞リボ核酸(cfRNA)分子を含む生物学的試験サンプルを取得すること;(b)前記生物学的試験サンプル中の1つ以上の標的RNA分子に由来する1つ以上の核酸配列の存在を定量的に検出して、腫瘍RNAスコアを決定することであって、前記1つ以上の標的RNA分子は表8および11~14のいずれか1つに記載された標的RNA分子から選択される、決定すること;および/または(c)前記腫瘍RNAスコアが閾値を超えた場合に、前記対象における、癌の存在を検出する、癌のステージを決定する、癌の進行を監視する、および/または癌の種類もしくはサブタイプを決定すること;を含む。 In some embodiments, the disclosed subject matter is used to detect the presence of cancer, determine the stage of cancer, determine the progression of cancer in a subject known to have or suspected of having cancer. A method of monitoring and/or determining a cancer type or cancer subtype, the method comprising: (a) obtaining from the subject a biological test sample comprising a plurality of cell-free ribonucleic acid (cfRNA) molecules; (b) quantitatively detecting the presence of one or more nucleic acid sequences derived from one or more target RNA molecules in said biological test sample to determine a tumor RNA score; determining, wherein said one or more target RNA molecules are selected from the target RNA molecules listed in any one of Tables 8 and 11-14; and/or (c) said tumor RNA score exceeds a threshold if exceeded, detecting the presence of cancer, determining the stage of cancer, monitoring cancer progression, and/or determining the type or subtype of cancer in said subject.

さまざまな実施形態によれば、本開示は、対象における癌の存在を検出するためのコンピュータ実装方法に関し、前記方法は、プロセッサおよびコンピュータ可読媒体を含むコンピュータでデータセットを受け取ることを含み、前記データセットは、前記対象からの生物学的試験サンプル中の複数のリボ核酸(RNA)分子から得られた複数の配列リードを含み、前記コンピュータ可読媒体は、前記プロセッサにより実行されるとき、前記コンピュータに以下を行わせる命令を含む:前記生物学的試験サンプル中の複数の標的RNA分子の発現レベルを決定すること;前記複数の標的RNA分子の各々の発現レベルをRNA組織スコア行列と比較して、前記複数の標的RNA分子の各々の癌指標スコアを決定すること;前記複数の標的RNA分子の各々の前記癌指標スコアを集計して、前記生物学的試験サンプルの癌指標スコアを生成すること;および/または前記生物学的試験サンプルの前記癌指標スコアが閾値を超えた場合に、前記対象における前記癌の存在を検出すること。 According to various embodiments, the present disclosure relates to a computer-implemented method for detecting the presence of cancer in a subject, said method comprising receiving a data set in a computer comprising a processor and a computer-readable medium, said data The set comprises a plurality of sequence reads obtained from a plurality of ribonucleic acid (RNA) molecules in a biological test sample from said subject, said computer readable medium, when executed by said processor, causing said computer to: comprising instructions to: determine expression levels of a plurality of target RNA molecules in said biological test sample; compare expression levels of each of said plurality of target RNA molecules to an RNA tissue score matrix; determining a cancer index score for each of the plurality of target RNA molecules; aggregating the cancer index scores for each of the plurality of target RNA molecules to generate a cancer index score for the biological test sample; and/or detecting the presence of said cancer in said subject when said cancer index score of said biological test sample exceeds a threshold.

さまざまな態様において、本開示の主題は、RNA組織スコア行列を構築する方法に関し、前記方法は、複数の対象から得られた複数のRNA配列リードを編集してRNA発現行列を生成すること;および前記RNA発現行列を組織特異的RNA発現行列で正規化して前記RNA組織スコア行列を構築すること;を含む。いくつかの実施形態において、既知の癌の種類を有する複数の対象から前記RNA配列リードを取得して、癌RNA組織スコア行列を構築する。 In various aspects, the presently disclosed subject matter relates to a method of constructing an RNA tissue score matrix, the method comprising compiling a plurality of RNA sequence reads obtained from a plurality of subjects to generate an RNA expression matrix; and normalizing said RNA expression matrix with a tissue-specific RNA expression matrix to construct said RNA tissue score matrix. In some embodiments, the RNA sequence reads are obtained from multiple subjects with known cancer types to construct a cancer RNA tissue score matrix.

いくつかの態様において、本明細書で開示される主題は、対象の無細胞RNA(cfRNA)分子の亜集団を測定する方法を提供する。実施形態において、前記方法は、(a)cfRNA分子をシーケンシングしてcfRNA配列リードを生成すること;(b)前記対象の細胞から抽出された細胞RNAをシーケンシングして細胞配列リードを生成すること;(c)前記細胞配列リードの1つ以上にマッチするcfRNA配列リードを除外することを含むフィルタリング手順を実行して、cfRNA配列リードの非除外集団を生成すること;および/または(d)前記非除外配列リードの1つ以上を定量化すること;を含む。 In some aspects, the presently disclosed subject matter provides methods of measuring a subpopulation of cell-free RNA (cfRNA) molecules in a subject. In embodiments, the method comprises (a) sequencing cfRNA molecules to generate cfRNA sequence reads; (b) sequencing cellular RNA extracted from cells of the subject to generate cellular sequence reads. (c) performing a filtering procedure comprising excluding cfRNA sequence reads that match one or more of said cellular sequence reads to generate a non-excluded population of cfRNA sequence reads; and/or (d) quantifying one or more of said non-excluded sequence reads;

いくつかの態様において、本開示は、1以上の対象から採取されたサンプル中の癌バイオマーカー(本明細書では「マーカー」とも呼ばれる)を同定する方法を提供する。実施形態において、前記方法は、(a)癌を有さない対象から採取された生体液のcfRNAをシーケンシングして非癌シーケンシングリードを生成すること;(b)癌を有する1以上の対象から採取された複数のマッチサンプルについて、(i)マッチサンプルの癌組織から採取されたDNAおよびRNAをシーケンシングして、前記癌組織のシーケンシングリードを生成すること;(ii)前記マッチサンプルのマッチ生体液から採取されたcfDNAおよびcfRNAをシーケンシングして、前記マッチ生体液のシーケンシングリードを生成すること;(iii)前記マッチ生体液のcfDNAシーケンシングリードのカウントを、前記癌組織のDNAシーケンシングリードの対応するカウントに関連付けることによって腫瘍フラクションを測定すること;および/または(iv)前記1つ以上の候補バイオマーカーの前記RNAシーケンシングリードのカウントに前記腫瘍フラクションを乗ずることによって、1つ以上の候補バイオマーカーの腫瘍コンテントを測定することであって、前記1つ以上の候補バイオマーカーが、前記癌のない対象から採取された生体液よりも、前記マッチ生体液中でより高いレベルで発現される、測定すること;(c)前記腫瘍コンテントを共変量として使用して、cfRNA中の前記1つ以上の候補バイオマーカーの発現をモデリングすること;および/または前記モデリングに基づいて、前記1つ以上の候補バイオマーカーの中から1つ以上のcfRNA癌バイオマーカーを同定すること、を含む。 In some aspects, the present disclosure provides methods of identifying cancer biomarkers (also referred to herein as "markers") in samples taken from one or more subjects. In embodiments, the method comprises (a) sequencing cfRNA in a biological fluid taken from a subject without cancer to generate non-cancer sequencing reads; (b) one or more subjects with cancer. (i) sequencing DNA and RNA taken from cancer tissue of the matched sample to generate sequencing reads for said cancer tissue; (ii) for a plurality of matched samples taken from sequencing cfDNA and cfRNA harvested from the match biological fluid to generate sequencing reads of said match biological fluid; (iii) counting the cfDNA sequencing reads of said match biological fluid from said cancer tissue DNA; and/or (iv) multiplying the count of said RNA sequencing reads of said one or more candidate biomarkers by said tumor fraction to determine the tumor fraction by relating it to the corresponding count of sequencing reads; measuring the tumor content of one or more candidate biomarkers, wherein the one or more candidate biomarkers are at a higher level in said match biological fluid than in a biological fluid taken from said cancer-free subject. (c) modeling expression of said one or more candidate biomarkers in cfRNA using said tumor content as a covariate; and/or based on said modeling, identifying one or more cfRNA cancer biomarkers among said one or more candidate biomarkers.

いくつかの態様において、本開示は、本明細書に開示される様々な態様のいずれかの方法における1つ以上のステップを実装するためのコンピュータシステムを提供する。 In some aspects, the disclosure provides computer systems for implementing one or more steps in the methods of any of the various aspects disclosed herein.

いくつかの態様において、本明細書で開示される主題は、本明細書で開示されるさまざまな態様のいずれかの方法における1つ以上のステップを実装するためのコンピュータ可読命令を格納した、非一時的なコンピュータ可読媒体を提供する。 In some aspects, the subject matter disclosed herein is a non-volatile memory device storing computer-readable instructions for implementing one or more steps in the methods of any of the various aspects disclosed herein. Provide temporary computer-readable media.

図1は、一実施形態によるシーケンシングのための核酸サンプルを調製する方法のフローチャートである。FIG. 1 is a flowchart of a method of preparing a nucleic acid sample for sequencing according to one embodiment. 図2は、本発明の一実施形態による、疾患状態を示す1つ以上のRNA配列を同定するための方法を示すフローダイアグラムである。Figure 2 is a flow diagram showing a method for identifying one or more RNA sequences indicative of a disease state, according to one embodiment of the invention. 図3は、本発明の一実施形態による、1つ以上の腫瘍由来RNA配列を同定するための方法を示すフローダイアグラムである。FIG. 3 is a flow diagram showing a method for identifying one or more tumor-derived RNA sequences, according to one embodiment of the invention. 図4は、本発明の一実施形態による、対象における癌の存在の検出、癌の状態の決定、癌の進行の監視、および/または癌の種類の決定のための方法を示すフローダイアグラムである。FIG. 4 is a flow diagram illustrating a method for detecting the presence of cancer, determining cancer status, monitoring cancer progression, and/or determining cancer type in a subject, according to one embodiment of the present invention. . 図5は、本発明の一実施形態による、1つ以上の標的RNA分子に由来する1つ以上の配列リードから疾患状態を検出する方法を示すフローダイアグラムである。FIG. 5 is a flow diagram showing a method for detecting disease states from one or more sequence reads derived from one or more target RNA molecules, according to one embodiment of the invention. 図6は、本発明の一実施形態による、癌指標スコアに基づいて対象における癌の存在を検出するための方法を示すフローダイアグラムである。Figure 6 is a flow diagram illustrating a method for detecting the presence of cancer in a subject based on a cancer index score, according to one embodiment of the invention. 図7は、一実施形態による、サンプル分類スキームの感度および特異性に関する結果の例を示す。FIG. 7 shows example results for the sensitivity and specificity of a sample classification scheme, according to one embodiment. 図8A-Cは、一実施形態による、サンプル分類スキームの感度および特異性に関する結果の例を示す。Figures 8A-C show example results for the sensitivity and specificity of a sample classification scheme, according to one embodiment. 図9は、癌性サンプルと非癌性サンプルとの間で最も高い発現レベル比を示す、肺癌における20個のダークチャネル遺伝子の発現レベルを示す。リード・パー・ミリオン(RPM)がダークチャネル遺伝子の関数としてプロットされている。各プロットでは、左から右のドットの列が、上部のレジェンドに左から右にそれぞれ示されている群(クラス、肛門直腸、***、結腸直腸、肺、および非癌)に対応する。FIG. 9 shows the expression levels of 20 dark channel genes in lung cancer showing the highest expression level ratios between cancerous and non-cancerous samples. Reads per million (RPM) are plotted as a function of dark channel genes. In each plot, the columns of dots from left to right correspond to the groups (class, anorectal, breast, colorectal, lung, and non-cancer) respectively indicated from left to right in the top legend. 図10は、ダークチャネル遺伝子から集計された組織スコアを使用した決定木分類器のROC曲線である。FIG. 10 is the ROC curve of the decision tree classifier using tissue scores aggregated from dark channel genes. 図11は、いくつかの実施形態による方法を示すフローチャートである。Figure 11 is a flow chart illustrating a method according to some embodiments. 図12Aは、ステージIIIのTCGA(癌ゲノムアトラス)FFPE(ホルマリン固定パラフィン包埋)組織RNA-seqデータのPCA(主成分分析)例の散布図である。遺伝子発現レベルは、リード・パー・ミリオンでプロットされている。図12Bは、TCGAのPCA軸上に投影された、CCGA(循環無細胞ゲノムアトラス)腫瘍組織RNA-seqデータの結果例を示す散布図である。遺伝子発現レベルは、リード・パー・ミリオンでプロットされている。図12Cは、TCGAのPCA軸上に投影された、CCGA癌無細胞RNA(cfRNA)RNA-seqデータの結果例を示す散布図である。遺伝子発現レベルは、リード・パー・ミリオンでプロットされている。FIG. 12A is a scatter plot of an example PCA (principal component analysis) of stage III TCGA (Cancer Genome Atlas) FFPE (formalin-fixed paraffin-embedded) tissue RNA-seq data. Gene expression levels are plotted in reads per million. FIG. 12B is a scatter plot showing example results of CCGA (Circulating Cell-Free Genome Atlas) tumor tissue RNA-seq data projected onto the PCA axis of TCGA. Gene expression levels are plotted in reads per million. FIG. 12C is a scatter plot showing example results of CCGA cancer cell-free RNA (cfRNA) RNA-seq data projected onto the PCA axis of TCGA. Gene expression levels are plotted in reads per million. 図13は、ダークチャネルバイオマーカー遺伝子の例のヒートマップである。各列は1つのcfRNAサンプルを示し、各行は1つの遺伝子を示す。行の色は組織特異性コードする(上から下に、組織はそれぞれ、***、肺、非特異的である)。列の色はサンプル群をコードする(左から右に、癌の種類はそれぞれ、肛門直腸癌、乳癌、結腸直腸癌、肺癌、非癌である)。FIG. 13 is a heat map of example dark channel biomarker genes. Each column represents one cfRNA sample and each row represents one gene. Row color codes tissue specificity (from top to bottom, tissues are breast, lung and non-specific, respectively). Column colors code sample groups (from left to right, cancer types are anorectal, breast, colorectal, lung, and non-cancer, respectively). 図14Aは、異なるサンプル(HER2+サンプル、HR+/HER2-サンプル、トリプルネガティブ乳癌(TNBC)サンプル、または非癌サンプル)における2つの例示的な***ダークチャネルバイオマーカー(DCB)遺伝子(FABP7およびSCGB2A2)のcfRNA発現レベルおよび組織発現レベルを示すボックスプロットを示す。図14Bは、異なるサンプル(腺癌サンプル、小細胞肺癌サンプル、扁平上皮癌サンプル、または非癌サンプル)における4つの例示的な肺DCB遺伝子(SLC34A2、ROS1、SFTPA2、およびCXCL17)のcfRNA発現レベルおよび組織発現レベルを示すボックスプロットを示す。FIG. 14A depicts two exemplary breast dark channel biomarker (DCB) genes (FABP7 and SCGB2A2) in different samples (HER2+ samples, HR+/HER2− samples, triple negative breast cancer (TNBC) samples, or non-cancer samples). Boxplots showing cfRNA expression levels and tissue expression levels are shown. FIG. 14B shows the cfRNA expression levels of four exemplary lung DCB genes (SLC34A2, ROS1, SFTPA2, and CXCL17) in different samples (adenocarcinoma samples, small cell lung cancer samples, squamous cell carcinoma samples, or non-cancer samples) and Boxplots showing tissue expression levels are shown. 図15Aは、マッチ腫瘍組織を有する乳癌サンプルについての2つの***DCB遺伝子(FABP7およびSCGB2A2)の検出可能性を示すフォレストプロットを示す。サンプルIDは、無細胞DNA(cfDNA)における相対的な腫瘍フラクションに基づいてプロットされている(95%CI)。FABP7はサンプル4653、4088、2037、3116および1202で検出された。SCGB2A2は、サンプル1656、2419、3911、2367、2037、1039、2139および3162で検出された。cfDNAにおける腫瘍フラクションは、cfDNA濃縮アッセイからのSNV対立遺伝子フラクションから測定された。図15Bは、マッチ腫瘍組織を有する乳癌サンプルについての2つの***DCB遺伝子(FABP7およびSCGB2A2)の検出可能性を示すフォレストプロットを示す。サンプルIDは、腫瘍コンテント(腫瘍フラクション*腫瘍組織発現)の関数としてプロットされている。FABP7はサンプル4088、1202、3116および2037で検出された。SCGB2A2はサンプル1656、2419、2367、3911、1039、2139、3162および2037で検出された。cfDNAにおける腫瘍フラクションは、cfDNA濃縮アッセイからのSNV対立遺伝子フラクションから測定された。組織発現は、マッチ腫瘍組織のRNA-seqデータから測定された。Figure 15A shows a forest plot showing the detectability of two breast DCB genes (FABP7 and SCGB2A2) for breast cancer samples with matched tumor tissue. Sample ID is plotted based on relative tumor fraction in cell-free DNA (cfDNA) (95% CI). FABP7 was detected in samples 4653, 4088, 2037, 3116 and 1202. SCGB2A2 was detected in samples 1656, 2419, 3911, 2367, 2037, 1039, 2139 and 3162. Tumor fractions in cfDNA were determined from SNV allele fractions from cfDNA enrichment assays. Figure 15B shows a forest plot showing the detectability of two breast DCB genes (FABP7 and SCGB2A2) for breast cancer samples with matching tumor tissue. Sample ID is plotted as a function of tumor content (tumor fraction*tumor tissue expression). FABP7 was detected in samples 4088, 1202, 3116 and 2037. SCGB2A2 was detected in samples 1656, 2419, 2367, 3911, 1039, 2139, 3162 and 2037. Tumor fractions in cfDNA were determined from SNV allele fractions from cfDNA enrichment assays. Tissue expression was determined from RNA-seq data of matched tumor tissue. 図16A-Dは、乳癌、肺癌または非癌(正常)対象の示された遺伝子についてcfRNAおよびマッチ組織におけるDCB遺伝子発現のシーケンシング結果の例を示す。リードカウントの数はY軸上に表されている。Figures 16A-D show examples of sequencing results of DCB gene expression in cfRNA and matched tissues for the indicated genes of breast cancer, lung cancer or non-cancer (normal) subjects. The number of read counts is represented on the Y-axis. 図17A-Bは、分類器ワークフローの例を示す。Figures 17A-B show an example of a classifier workflow. 図18A-Cは、例示的な分類スキームの感度および特異性を示すROCプロットを示す。Figures 18A-C show ROC plots showing the sensitivity and specificity of an exemplary classification scheme. 図19は、本発明の一実施形態による、サンプル処理およびパラメータ決定方法を示す。FIG. 19 illustrates a sample processing and parameter determination method according to one embodiment of the present invention. 図20A-Bは、一実施形態による、選択された乳癌および肺癌に特異的なバイオマーカーの分布を示し、非癌由来cfRNAと比較して乳癌および肺癌由来(それぞれ)cfRNAにおけるシグナルの増加を示す。全トランスクリプトームサンプルは、乳癌、肺癌、および非癌のCCGA参加者のcfRNAから調製された。20A-B show the distribution of selected breast and lung cancer specific biomarkers showing increased signal in breast and lung cancer (respectively) cfRNA compared to non-cancer derived cfRNA, according to one embodiment. . Whole transcriptome samples were prepared from cfRNA of breast, lung, and non-cancer CCGA participants. 図21は、全トランスクリプトームCCGA乳癌サンプルからのマッチする血漿および組織の遺伝子発現を示す。結果は、組織での高い発現が必ずしも血漿中への高い排出率をもたらすわけではないことを示している。FIG. 21 shows matched plasma and tissue gene expression from whole transcriptome CCGA breast cancer samples. The results show that high tissue expression does not necessarily lead to high plasma excretion rates. 図22は、CCGA血漿におけるダークチャネル発現が乳癌のCCGA腫瘍組織発現と相関していることを示す散布図を示す。血漿または組織の平均発現がゼロの遺伝子は、視覚化の目的で1e-4に変換されている。FIG. 22 shows a scatter plot demonstrating that dark channel expression in CCGA plasma correlates with CCGA tumor tissue expression in breast cancer. Genes with zero mean plasma or tissue expression have been converted to 1e-4 for visualization purposes. 図23は、CCGA血漿におけるダークチャネル発現が肺癌のCCGA腫瘍組織発現と相関していることを示す散布図である。血漿または組織の平均発現がゼロの遺伝子は、視覚化の目的で1e-4に変換されている。FIG. 23 is a scatter plot showing that dark channel expression in CCGA plasma correlates with CCGA tumor tissue expression in lung cancer. Genes with zero mean plasma or tissue expression have been converted to 1e-4 for visualization purposes. 図24は、CCGA血漿サンプル中の腫瘍特異的マーカーを示すグラフである。血漿対数オッズ比は、すべての癌血漿とすべての非癌血漿の観察に基づいて、各遺伝子について計算された。示されている遺伝子は、ダークチャネルバイオマーカーの例を示す。Figure 24 is a graph showing tumor-specific markers in CCGA plasma samples. Plasma log-odds ratios were calculated for each gene based on observations of all cancer plasma and all non-cancer plasma. The indicated genes represent examples of dark channel biomarkers. 図25は、供給源および同定方法によってグループ化された表15のcfRNAバイオマーカーの分布を示すベン図である。図のすべてのグループに存在する38個のバイオマーカーを表14に示す。遺伝子は、バイナリ検出について最適化し、起源組織(TOO)について最適化するためにフィルタリングされる。バイナリ検出の最適化のためにフィルタリングされた遺伝子は、対数オッズ比>0.1のCCGA血漿で観察され、乳癌および肺癌では高いTCGA発現(>5RPM)の遺伝子が観察された。TOOの最適化のためにフィルタリングされた遺伝子は、TCGA組織からマルチクラスランダムフォレスト法によって選択された遺伝子、およびヒトタンパク質アトラスで***/肺腫瘍または組織特異的としてアノテーションが付けられた遺伝子であった。FIG. 25 is a Venn diagram showing the distribution of the cfRNA biomarkers of Table 15 grouped by source and identification method. The 38 biomarkers present in all groups of figures are shown in Table 14. Genes are filtered to optimize for binary detection and optimize for tissue of origin (TOO). Genes filtered for binary detection optimization were observed in CCGA plasma with a log odds ratio >0.1, and genes with high TCGA expression (>5 RPM) in breast and lung cancers. Genes filtered for TOO optimization were genes selected by multiclass random forest method from TCGA tissues and genes annotated as breast/lung tumor or tissue-specific in the Human Protein Atlas . 図26A-Dは、一実施形態による、非癌対象と比較した、乳癌および/または肺癌で検出される選択されたバイオマーカーのレベルを示す。結果は、非癌由来cfRNAと比較して、乳癌および/または肺癌由来cfRNAで(それぞれ)シグナルが増加していることを示す。全トランスクリプトームサンプルは、乳癌、肺癌および非癌のCCGA参加者のcfRNAから調製された。Figures 26A-D show levels of selected biomarkers detected in breast cancer and/or lung cancer compared to non-cancer subjects, according to one embodiment. The results show increased signal for breast and/or lung cancer-derived cfRNA (respectively) compared to non-cancer derived cfRNA. Whole transcriptome samples were prepared from cfRNA of breast, lung and non-cancer CCGA participants.

発明の詳細な説明Detailed description of the invention

本発明をより詳細に説明する前に、本発明は、当然ながら、異なる場合があるので、説明された特定の実施形態に限定されないことを理解されたい。また、本明細書で使用される用語は、特定の実施形態を説明するためのものであり、本発明の範囲は添付の特許請求の範囲によってのみ限定されるため、限定を意図するものではないことを理解されたい。 Before describing the invention in more detail, it is to be understood that this invention is not limited to the particular embodiments described, as these may, of course, vary. Also, the terminology used herein is for the purpose of describing particular embodiments and is not intended to be limiting, as the scope of the invention is limited only by the appended claims. Please understand.

値の範囲が提供される場合、文脈上明らかにそうでない場合を除き、その範囲の上限と下限の間の、下限の単位の10分の1までの各介在値、およびその記載された範囲内の他の記載されたまたは介在する値、ならびにその範囲の提供された各終点は、本発明に包含されると理解される。これらのより小さい範囲の上限および下限は、記載された範囲内で特に除外される制限を条件として、本発明に包含されるより小さい範囲に独立して含まれ得る。 Where a range of values is provided, each intervening value between the upper and lower limits of the range to tenths of the unit of the lower limit, and within the stated range, unless the context clearly indicates otherwise. It is understood that each other stated or intervening value of , as well as the provided endpoints of the range, are encompassed in the invention. The upper and lower limits of these smaller ranges may independently be included in the smaller ranges encompassed by the invention, subject to any specifically excluded limit in the stated range.

別段の定義がない限り、本明細書で使用される技術用語および科学用語は、本発明が属する技術分野の当業者によって一般に理解されるものと同じ意味を有する。Singleton et al., Dictionary of Microbiology and Molecular Biology 第2版、J. Wiley & Sons(ニューヨーク、ニューヨーク州、1994年)は、当業者に、本出願で使用される用語の多くに対する一般的なガイドを提供し、以下も同様であり、その各々は参照によりその全体が本明細書に組み込まれる:Kornberg and Baker, DNA Replication、第2版(W.H. Freeman、ニューヨーク、1992年);Lehninger, Biochemistry、第2版(Worth Publishers、ニューヨーク、1975年);Strachan and Read, Human Molecular Genetics、第2版(Wiley-Liss、ニューヨーク、1999年);Abbas et al, Cellular and Molecular Immunology、第6版(Saunders、2007年)。 Unless defined otherwise, technical and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Singleton et al. , Dictionary of Microbiology and Molecular Biology 2nd Edition, J. Am. Wiley & Sons (New York, NY, 1994) provides those skilled in the art with a general guide to many of the terms used in this application, as well as the following, each of which is incorporated by reference in its entirety: Incorporated herein are: Kornberg and Baker, DNA Replication, 2nd ed. (WH Freeman, New York, 1992); Lehninger, Biochemistry, 2nd ed. (Worth Publishers, New York, 1975); Strachan and Read. , Human Molecular Genetics, 2nd ed. (Wiley-Liss, New York, 1999); Abbas et al, Cellular and Molecular Immunology, 6th ed. (Saunders, 2007).

本明細書で言及されたすべての出版物は、引用された出版物に関連する方法および/または材料を開示および説明するために、参照により明示的に本明細書に組み込まれる。 All publications mentioned herein are expressly incorporated herein by reference to disclose and describe the methods and/or materials in connection with which the publications are cited.

「ポリヌクレオチド」、「核酸」および「オリゴヌクレオチド」という用語は互換的に使用される。それらは、デオキシリボヌクレオチドまたはリボヌクレオチド、またはそれらの類似体のいずれかである、任意の長さのヌクレオチドのポリマー形態を指す。ポリヌクレオチドは、任意の三次元構造を持つことができ、既知または未知の任意の機能を実行することができる。以下はポリヌクレオチドの非限定的な例である:遺伝子または遺伝子断片のコード領域または非コード領域、連鎖分析から規定された遺伝子座(複数可)、エクソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA(tRNA)、リボソームRNA(rRNA)、短鎖干渉RNA(siRNA)、ショートヘアピンRNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離DNA、任意の配列の単離RNA、核酸プローブ、およびプライマー。ポリヌクレオチドは、メチル化ヌクレオチドおよびヌクレオチド類似体などの1つ以上の修飾ヌクレオチドを含み得る。存在する場合、ヌクレオチド構造への修飾は、ポリマーのアセンブリの前または後に付与され得る。ヌクレオチドの配列は、非ヌクレオチド成分によって中断される場合がある。ポリヌクレオチドは、標識成分とのコンジュゲーションなどにより、重合後にさらに修飾され得る。 The terms "polynucleotide", "nucleic acid" and "oligonucleotide" are used interchangeably. They refer to a polymeric form of nucleotides of any length, either deoxyribonucleotides or ribonucleotides, or analogs thereof. Polynucleotides can have any three-dimensional structure and can perform any known or unknown function. The following are non-limiting examples of polynucleotides: coding or non-coding regions of a gene or gene fragment, locus(s) defined from linkage analysis, exons, introns, messenger RNA (mRNA), transfer RNA. (tRNA), ribosomal RNA (rRNA), short interfering RNA (siRNA), short hairpin RNA (shRNA), microRNA (miRNA), ribozymes, cDNA, recombinant polynucleotides, branched polynucleotides, plasmids, vectors, any Isolated DNA of sequence, isolated RNA of any sequence, nucleic acid probes, and primers. A polynucleotide may comprise one or more modified nucleotides, such as methylated nucleotides and nucleotide analogs. If present, modifications to the nucleotide structure can be imparted before or after assembly of the polymer. A sequence of nucleotides may be interrupted by non-nucleotide components. A polynucleotide may be further modified after polymerization, such as by conjugation with a labeling component.

一般に、「標的ポリヌクレオチド」という用語は、その存在、量、および/もしくはヌクレオチド配列、またはこれらのうちの1つ以上の変化を決定することが望まれる標的配列を有する、核酸分子の出発集団中の核酸分子またはポリヌクレオチドを指す。一般に、「標的配列」という用語は、核酸の一本鎖上の核酸配列を指す。標的配列は、遺伝子、調節配列、ゲノムDNA、cDNA、mRNA、miRNA、rRNAを含むRNAなどの一部であり得る。標的配列は、サンプルからの標的配列であってもよいし、増幅反応の産物などの二次標的であってもよい。 Generally, the term "target polynucleotide" refers to a starting population of nucleic acid molecules having a target sequence whose presence, amount, and/or nucleotide sequence, or changes in one or more of these, is desired to be determined. refers to a nucleic acid molecule or polynucleotide of In general, the term "target sequence" refers to a nucleic acid sequence on a single strand of nucleic acid. A target sequence can be part of a gene, regulatory sequence, genomic DNA, cDNA, mRNA, miRNA, RNA including rRNA, and the like. A target sequence may be a target sequence from a sample or a secondary target such as a product of an amplification reaction.

「マーカー」および「バイオマーカー」という用語は、本明細書では、特定の生物学的状態(例えば、一般的な癌の存在、または特定の癌の種類および/もしくはステージなどの疾患状態)に関連するレベルまたは濃度のポリヌクレオチド(例えば、遺伝子またはその同定可能な配列断片)を指すために互換的に使用される。実施形態において、マーカーは、特定の遺伝子のcfRNAであり、そのレベルの変化は、シーケンシングによって検出され得る。cfRNAバイオマーカーは、本明細書ではcfRNAが由来する遺伝子を参照して言及される場合があるが、遺伝子転写産物全体を検出する必要はない。実施形態において、特定の遺伝子転写産物の断片のみが検出される。実施形態において、特定の遺伝子の存在および/またはレベルを検出することは、同じ遺伝子の転写産物に由来する異なる配列断片(重複または非重複)を含む1つ以上のcfRNA断片を検出することを含み、これらは同じ「バイオマーカー」の一部としてまとめてスコア化されることがある。配列情報(例えば、DNA、RNA、およびアミノ酸配列)、遺伝子記号によって一般的に同定される遺伝子の完全名称などを含む、記載された遺伝子指定に関連する追加情報は、当業者に既知の公にアクセス可能なデータベース、例えば、GenBank(www.ncbi.nlm.nih.gov/genbank/)およびNCBI Protein database(www.ncbi.nlm.nih.gov/protein/)を含むアメリカ国立生物工学情報センター(www.ncbi.nlm.nih.gov/)から入手可能なデータベース、ならびにUniProt(www.uniprot.org)で入手可能である。 The terms "marker" and "biomarker" are used herein to relate to a particular biological state (e.g., the presence of cancer in general, or a disease state such as a particular cancer type and/or stage). used interchangeably to refer to a level or concentration of a polynucleotide (eg, a gene or an identifiable sequence fragment thereof). In embodiments, the marker is the cfRNA of a particular gene and changes in its level can be detected by sequencing. cfRNA biomarkers may be referred to herein with reference to the gene from which the cfRNA is derived, but need not detect the entire gene transcript. In embodiments, only fragments of specific gene transcripts are detected. In embodiments, detecting the presence and/or level of a particular gene comprises detecting one or more cfRNA fragments comprising different sequence segments (overlapping or non-overlapping) derived from transcripts of the same gene. , which may be scored together as part of the same 'biomarker'. Additional information relating to the given gene designation, including sequence information (e.g., DNA, RNA, and amino acid sequences), full name of the gene commonly identified by the gene symbol, etc., is publicly available and known to those of skill in the art. Accessible databases such as GenBank (www.ncbi.nlm.nih.gov/genbank/) and the NCBI Protein database (www.ncbi.nlm.nih.gov/protein/), including the National Center for Biotechnology Information (www.www.ncbi.nlm.nih.gov/protein/) .ncbi.nlm.nih.gov/) as well as at UniProt (www.uniprot.org).

本明細書で使用する「アンプリコン」という用語は、ポリヌクレオチド増幅反応の産物を意味する。すなわち、1つ以上の出発配列から複製された、1本鎖でも2本鎖であってもよい、ポリヌクレオチドのクローン集団である。1つ以上の出発配列は、同じ配列の1つ以上のコピーであってもよいし、異なる配列の混合物であってもよい。好ましくは、アンプリコンは単一の出発配列の増幅によって形成される。アンプリコンは、生成物が1つ以上の出発核酸または標的核酸の複製物を含むさまざまな増幅反応によって生成され得る。一態様において、アンプリコンを生成する増幅反応は、反応物(ヌクレオチドまたはオリゴヌクレオチド)の塩基対が、反応産物の生成に必要なテンプレートポリヌクレオチドの相補性を有するという点で、「テンプレート駆動型」である。一態様において、テンプレート駆動反応は、核酸ポリメラーゼによるプライマー伸長、または核酸リガーゼによるオリゴヌクレオチドのライゲーションである。このような反応には、限定されるものではないが、ポリメラーゼ連鎖反応(PCR)、線状ポリメラーゼ反応、核酸配列に基づく増幅(NASBA)、ローリングサークル増幅などが含まれ、以下の文献に開示されており、これらの文献の各々は参照によりその全体が本明細書に組み込まれる:Mullisら、米国特許第4,683,195号;第4,965,188号;第4,683,202号;第4,800,159号(PCR);Gelfandら、米国特許第5,210,015号(taqman”プローブを用いたリアルタイムPCR);Wittwerら、米国特許第6,174,670号;Kacianら、米国特許第5,399,491号(“NASBA”);Lizardi、米国特許第5,854,033号;Aonoら、Japanese patent publ.特開平4-262799号公報(ローリングサークル増幅)など。一態様において、本発明のアンプリコンはPCRによって生成される。増幅反応が進行するにつれて反応産物を測定することを可能にする検出化学が利用可能であれば、増幅反応は「リアルタイム」増幅であってもよい。例えば、「リアルタイムPCR」、またはLeone et al, Nucleic Acids Research,26:2150-2155頁(1998年)および同様の参考文献に記載の「リアルタイムNASBA」。 As used herein, the term "amplicon" means the product of a polynucleotide amplification reaction. That is, a clonal population of polynucleotides, which may be single-stranded or double-stranded, replicated from one or more starting sequences. The one or more starting sequences can be one or more copies of the same sequence or a mixture of different sequences. Preferably, amplicons are formed by amplification of a single starting sequence. Amplicons can be produced by a variety of amplification reactions in which the products comprise copies of one or more starting or target nucleic acids. In one aspect, the amplification reaction that produces the amplicon is "template-driven" in that the base pairs of the reactants (nucleotides or oligonucleotides) have the necessary complementarity to the template polynucleotide to produce the reaction product. is. In one aspect, the template-driven reaction is primer extension with a nucleic acid polymerase or ligation of oligonucleotides with a nucleic acid ligase. Such reactions include, but are not limited to, polymerase chain reaction (PCR), linear polymerase reaction, nucleic acid sequence-based amplification (NASBA), rolling circle amplification, etc., and are disclosed in the following references: , each of which is incorporated herein by reference in its entirety: Mullis et al., U.S. Pat. Nos. 4,683,195; 4,965,188; 4,683,202; 4,800,159 (PCR); Gelfand et al., U.S. Patent No. 5,210,015 (real-time PCR using taqman" probes); Wittwer et al., U.S. Patent No. 6,174,670; Kacian et al. Lizardi, US Pat. No. 5,854,033; Aono et al., Japanese patent publ. In, the amplicons of the present invention are generated by PCR, even if the amplification reaction is "real-time" amplification if detection chemistries are available that allow measurement of reaction products as the amplification reaction progresses. good. For example, "real-time PCR" or "real-time NASBA" as described in Leone et al, Nucleic Acids Research, 26:2150-2155 (1998) and similar references.

「増幅する」という用語は、増幅反応を行うことを意味する。「反応混合物」とは、反応を行うために必要なすべての反応物を含む溶液を意味し、反応物は、限定されるものではないが、反応中にpHを選択されたレベルに維持するための緩衝剤、塩、補因子、スカベンジャーなどを含み得る。 The term "amplify" means to carry out an amplification reaction. By "reaction mixture" is meant a solution containing all the reactants necessary to carry out a reaction, including but not limited to maintaining the pH at a selected level during the reaction. buffers, salts, cofactors, scavengers, and the like.

「断片」または「セグメント」という用語は、本明細書で互換的に用いられる場合、より大きなポリヌクレオチド分子の一部を指す。例えば、ポリヌクレオチドは、生物学的サンプル内で自然に発生し得るcfDNA断片などの場合のような自然プロセスを通じて、またはin vitro操作を通じて、複数のセグメントに分解または断片化され得る。核酸を断片化するさまざまな方法が当技術分野でよく知られている。これらの方法は、例えば、本質的に化学的、物理的、または酵素的のいずれかであり得る。酵素的断片化は、DNaseによる部分分解;酸による部分脱プリン化;制限酵素の使用;イントロンにコードされたエンドヌクレアーゼ;核酸セグメントの特異的ハイブリダイゼーションに依存して切断剤を核酸分子の特定の位置に局在させる、三重鎖およびハイブリッド形成法などのDNAベースの切断法;または既知もしくは未知の位置でポリヌクレオチドを切断する他の酵素もしくは化合物、を含み得る。物理的断片化法は、ポリヌクレオチドを高いせん断速度にさらすことを含み得る。高いせん断速度は、例えば、ピットまたはスパイクを備えたチャンバーまたはチャネルを通してDNAを移動させることによって、あるいは制限されたサイズの流路、例えばミクロンまたはサブミクロン範囲の断面寸法を有する開口部にDNAサンプルを強制的に通過させることによって生成され得る。その他の物理的方法としては、超音波処理およびネブライゼーションが挙げられる。熱およびイオン媒介加水分解による断片化など、物理的断片化法と化学的断片化法の組み合わせも同様に使用することができる。例えば、あらゆる目的のために参照により本明細書に組み込まれる、Sambrook et al., “Molecular Cloning:A Laboratory Manual,” 第3版、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、ニューヨーク(2001年)(Sambrook et al.)を参照されたい。これらの方法は、核酸を選択したサイズ範囲の断片に消化するように最適化され得る。 The terms "fragment" or "segment," as used interchangeably herein, refer to a portion of a larger polynucleotide molecule. For example, a polynucleotide can be degraded or fragmented into multiple segments through natural processes, such as cfDNA fragments, which can occur naturally in a biological sample, or through in vitro manipulation. Various methods of fragmenting nucleic acids are well known in the art. These methods can be either chemical, physical, or enzymatic in nature, for example. partial depurination by acid; use of restriction enzymes; intron-encoded endonucleases; location-localized DNA-based cleavage methods, such as triplex and hybridization methods; or other enzymes or compounds that cleave polynucleotides at known or unknown locations. Physical fragmentation methods can involve subjecting polynucleotides to high shear rates. High shear rates can be used, for example, by moving the DNA through chambers or channels with pits or spikes, or into channels of limited size, such as openings with cross-sectional dimensions in the micron or submicron range. It can be generated by forcing it through. Other physical methods include sonication and nebulization. A combination of physical and chemical fragmentation methods can be used as well, such as fragmentation by thermal and ion-mediated hydrolysis. See, for example, Sambrook et al., which is incorporated herein by reference for all purposes. , "Molecular Cloning: A Laboratory Manual," 3rd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York (2001) (Sambrook et al.). These methods can be optimized to digest nucleic acids into fragments of a selected size range.

「ポリメラーゼ連鎖反応」または「PCR」という用語は、本明細書で互換的に使用される場合、DNAの相補鎖の同時プライマー伸長による、特定のDNA配列のin vitro増幅のための反応を意味する。換言すると、PCRは、プライマー結合部位で挟まれた標的核酸の多重コピーまたは複製を作るための反応であり、そのような反応は、以下のステップの1回以上の繰り返しを含む:(i)標的核酸の変性、(ii)プライマー結合部位へのプライマーのアニーリング、および(iii)ヌクレオシド三リン酸の存在下における核酸ポリメラーゼによるプライマーの伸長。通常、反応はサーマルサイクラー装置を用いて、各ステップ毎に最適化された異なる温度で循環される。特定の温度、各ステップの持続時間、およびステップ間の変化速度は、例えば以下の文献に例示される、当業者に周知の多くの要因に依存する:McPherson et al,編、PCR:A Practical ApproachおよびPCR2:A Practical Approach(IRL Press、Oxford、それぞれ1991年および1995年)。例えば、Taq DNAポリメラーゼを使用する従来のPCRでは、二本鎖標的核酸を90℃超の温度で変性させ、プライマーを50~75℃の範囲の温度でアニーリングさせ、プライマーを72~78℃の範囲の温度で伸長させる場合がある。「PCR」という用語は、RT-PCR、リアルタイムPCR、ネステッドPCR、定量的PCR、マルチプレックスPCRなどを含むがこれらに限定されない反応の派生形態を包含する。用いられるPCRの特定の形式は、出願の文脈から当業者には識別可能である。反応容量は、数百ナノリットル(例えば200nL)~数百μL(例えば200μL)の範囲であり得る。「逆転写PCR」または「RT-PCR」は、標的RNAを相補的な一本鎖DNAに変換する逆転写反応が先行し、次いで増幅されるPCRを意味し、その例はTecottら、米国特許第5,168,038号に記載されており、その開示は参照によりその全体が本明細書に組み込まれる。「リアルタイムPCR」とは、反応の進行に伴って反応産物、すなわちアンプリコンの量がモニターされるPCRを意味する。リアルタイムPCRには多くの形式があり、主に反応産物をモニターするために使用される検出化学が異なる。例えば、Gelfandら、米国特許第5,210,015号(“taqman”);Wittwerら、米国特許第6,174,670号および第6,569,627号(intercalating dyes);Tyagiら、米国特許第5,925,517号(molecular beacons);これらの開示は、その全体が参照により本明細書に組み込まれる。リアルタイムPCRの検出化学はMackay et al, Nucleic Acids Research, 30:1292-1305頁(2002年)で概説されており、これも参照により本明細書に組み込まれる。「ネステッドPCR」とは、第1のPCRのアンプリコンが、新しいプライマーセットを用いた第2のPCRのサンプルとなる2段階のPCRを意味し、プライマーの少なくとも1つは第1のアンプリコンの内部の位置に結合する。本明細書で使用される場合、ネステッド増幅反応に関する「初期プライマー」とは、第1のアンプリコンを生成するために使用されるプライマーを意味し、「二次プライマー」とは、第2の、またはネステッドアンプリコンを生成するために使用される1つ以上のプライマーを意味する。「非対称PCR」とは、使用される2つのプライマーの一方が大過剰濃度であるため、反応が主に標的核酸の2本鎖の一方が優先的にコピーされる線形増幅となるPCRを意味する。非対称PCRプライマーの過剰濃度は、濃度比として表すことができる。典型的な比は10~100の範囲である。「マルチプレックスPCR」とは、複数の標的配列(または単一の標的配列および1つ以上の参照配列)が同じ反応混合物中で同時に実行されるPCRを意味する。例えば、Bernard et al, Anal. Biochem., 273:221-228頁(1999年)(2色リアルタイルPCR)。通常、増幅される配列ごとに異なるプライマーセットが使用される。典型的には、マルチプレックスPCRにおける標的配列の数は2~50、または2~40、または2~30の範囲である。「定量的PCR」とは、サンプルまたは検体中の1つ以上の特定の標的配列の存在量を測定するように設計されたPCRを意味する。定量的PCRには、そのような標的配列の絶対定量化と相対定量化の両方が含まれる。定量的測定は、標的配列とは別に、または標的配列と一緒にアッセイできる1つ以上の参照配列または内部標準を用いて行われる。参照配列は、サンプルまたは検体に対して内因性であっても外因性であってもよく、後者の場合には、1つ以上の競合テンプレートを含み得る。典型的な内因性参照配列には、β-アクチン、GAPDH、β2-ミクログロブリン、リボソームRNAなどの遺伝子の転写産物のセグメントが含まれる。定量的PCRの技術は、以下の参考文献に例示されているように、当業者には周知であり、その全体が参照により本明細書に組み込まれる:Freeman et al,Biotechniques,26:112-126頁(1999);Becker-Andre et al,Nucleic Acids Research,17:9437-9447頁(1989年);Zimmerman et al, Biotechniques,21:268-279頁(1996年);Diviacco et al,Gene,122:3013-3020頁(1992年);およびBecker-Andre et al,Nucleic Acids Research,17:9437-9446頁(1989年)。 The terms "polymerase chain reaction" or "PCR," as used interchangeably herein, refer to a reaction for the in vitro amplification of specific DNA sequences by simultaneous primer extension of complementary strands of DNA. . In other words, PCR is a reaction to make multiple copies or duplicates of a target nucleic acid flanked by primer binding sites, such reaction comprising one or more repetitions of the following steps: (i) target Denaturation of the nucleic acid, (ii) annealing of the primer to the primer binding site, and (iii) extension of the primer by a nucleic acid polymerase in the presence of nucleoside triphosphates. Usually the reaction is cycled at different temperatures optimized for each step using a thermal cycler apparatus. The specific temperatures, duration of each step, and rate of change between steps depend on many factors well known to those skilled in the art, exemplified, for example, in McPherson et al, ed., PCR: A Practical Approach. and PCR2: A Practical Approach (IRL Press, Oxford, 1991 and 1995, respectively). For example, in conventional PCR using Taq DNA polymerase, double-stranded target nucleic acids are denatured at temperatures above 90°C, primers are annealed at temperatures in the range of 50-75°C, and primers are annealed at temperatures in the range of 72-78°C. It may be stretched at a temperature of The term "PCR" encompasses derivative forms of reactions including, but not limited to, RT-PCR, real-time PCR, nested PCR, quantitative PCR, multiplex PCR, and the like. The particular format of PCR used is identifiable to one skilled in the art from the context of the application. Reaction volumes can range from hundreds of nanoliters (eg, 200 nL) to hundreds of μL (eg, 200 μL). "Reverse transcription PCR" or "RT-PCR" means PCR preceded by a reverse transcription reaction that converts target RNA into complementary single-stranded DNA, followed by amplification, examples of which are Tecott et al., US Pat. No. 5,168,038, the disclosure of which is incorporated herein by reference in its entirety. "Real-time PCR" means PCR in which the amount of reaction products, ie amplicons, is monitored as the reaction progresses. There are many formats of real-time PCR, differing primarily in the detection chemistries used to monitor reaction products. See, for example, Gelfand et al., U.S. Pat. No. 5,210,015 ("taqman"); Wittwer et al., U.S. Pat. No. 5,925,517 (molecular beacons); the disclosures of which are incorporated herein by reference in their entireties. Real-time PCR detection chemistry is reviewed in Mackay et al, Nucleic Acids Research, 30:1292-1305 (2002), also incorporated herein by reference. "Nested PCR" means a two-step PCR in which the amplicon of the first PCR serves as a sample for a second PCR using a new set of primers, at least one of the primers of the first amplicon. Bind to an internal position. As used herein, "initial primer" with respect to a nested amplification reaction means the primer used to generate the first amplicon, and "secondary primer" means the second, Or one or more primers used to generate nested amplicons. "Asymmetric PCR" means a PCR in which one of the two primers used is in large excess concentration so that the reaction is primarily linear amplification in which one of the two strands of the target nucleic acid is preferentially copied. . The excess concentration of asymmetric PCR primers can be expressed as a concentration ratio. Typical ratios range from 10-100. "Multiplex PCR" means PCR in which multiple target sequences (or a single target sequence and one or more reference sequences) are performed simultaneously in the same reaction mixture. See, eg, Bernard et al, Anal. Biochem. , 273:221-228 (1999) (two-color real-tile PCR). A different primer set is usually used for each sequence to be amplified. Typically, the number of target sequences in multiplex PCR ranges from 2-50, or 2-40, or 2-30. "Quantitative PCR" means PCR designed to measure the abundance of one or more specific target sequences in a sample or specimen. Quantitative PCR includes both absolute and relative quantification of such target sequences. Quantitative measurements are made using one or more reference sequences or internal standards that can be assayed separately or together with the target sequence. A reference sequence may be endogenous or exogenous to the sample or specimen, and in the latter case may include one or more competing templates. Typical endogenous reference sequences include segments of transcripts of genes such as β-actin, GAPDH, β2-microglobulin, ribosomal RNA. The technique of quantitative PCR is well known to those of skill in the art, as exemplified in the following references, which are incorporated herein by reference in their entireties: Freeman et al, Biotechniques, 26:112-126. (1999); Becker-Andre et al, Nucleic Acids Research, 17:9437-9447 (1989); Zimmerman et al, Biotechniques, 21:268-279 (1996); 22 : 3013-3020 (1992); and Becker-Andre et al, Nucleic Acids Research, 17:9437-9446 (1989).

本明細書で使用する「プライマー」という用語は、天然または合成のオリゴヌクレオチドであって、ポリヌクレオチドテンプレートと二重鎖を形成する際に、核酸合成の開始点として働き、テンプレートに沿ってその3’末から伸長されて、伸長二重鎖を形成することができるものをいう。プライマーの伸長は、通常、DNAまたはRNAポリメラーゼなどの核酸ポリメラーゼを用いて行われる。伸長プロセスで付加されるヌクレオチドの配列は、テンプレートポリヌクレオチドの配列によって決定される。通常、プライマーはDNAポリメラーゼによって伸長される。プライマーは、通常、14~40ヌクレオチドの範囲、または18~36ヌクレオチドの範囲の長さを有する。プライマーは、例えば、単一のプライマーを使用する線形増幅反応、または2つ以上のプライマーを使用するポリメラーゼ連鎖反応など、さまざまな核酸増幅反応に使用される。特定の用途のためにプライマーの長さおよび配列を選択するための指針は、参照によりその全体が本明細書に組み込まれる以下の文献によって証明されるように、当業者にはよく知られている:Dieffenbach編、PCR Primer:A Laboratory Manual、第2版(Cold Spring Harbor Press、ニューヨーク、2003年)。 As used herein, the term "primer" refers to a natural or synthetic oligonucleotide that, in forming a duplex with a polynucleotide template, serves as a point of initiation for nucleic acid synthesis, along with the template. It refers to those that can be extended from the ' end to form an extended double strand. Extension of the primer is typically performed using a nucleic acid polymerase, such as a DNA or RNA polymerase. The sequence of nucleotides added in the extension process is determined by the sequence of the template polynucleotide. A primer is usually extended by a DNA polymerase. Primers usually have lengths in the range of 14-40 nucleotides, or in the range of 18-36 nucleotides. Primers are used in a variety of nucleic acid amplification reactions such as, for example, linear amplification reactions using a single primer, or polymerase chain reactions using two or more primers. Guidance for selecting primer lengths and sequences for a particular application is well known to those of ordinary skill in the art, as evidenced by the following references, which are incorporated herein by reference in their entirety: : Dieffenbach, ed., PCR Primer: A Laboratory Manual, 2nd ed. (Cold Spring Harbor Press, New York, 2003).

「対象」および「患者」という用語は、本明細書では互換的に使用され、例えば癌などの医学的状態または障害を有することが知られている、または有する可能性があるヒトまたはヒト以外の動物を指す。 The terms "subject" and "patient" are used interchangeably herein and refer to a human or non-human person known to have or likely to have a medical condition or disorder, e.g., cancer. point to the animal.

本明細書で使用する「配列リード」という用語は、対象から得られたサンプル由来の核酸分子の一部または全部から得られるヌクレオチドの文字列を意味する。配列リードは、核酸断片からシーケンシングされたヌクレオチドの短い文字列(例えば、20~150)、核酸断片の片端または両端のヌクレオチドの短い文字列、または生物学的サンプル中に存在する核酸断片全体のシーケンシングであり得る。配列リードは、当技術分野で知られているさまざまな方法によって得ることができる。例えば、配列リードは、さまざまな方法、例えば、シーケンシング技術を使用して、またはプローブを使用して、例えば、ハイブリダイゼーションアレイまたはキャプチャープローブにおいて、または増幅技術、例えば、ポリメラーゼ連鎖反応(PCR)または単一プライマーを使用する線形増幅または等温増幅において得ることができる。 As used herein, the term "sequence read" refers to a string of nucleotides obtained from part or all of a nucleic acid molecule from a sample obtained from a subject. A sequence read is a short string of nucleotides (eg, 20-150) sequenced from a nucleic acid fragment, a short string of nucleotides at one or both ends of a nucleic acid fragment, or an entire nucleic acid fragment present in a biological sample. It can be sequencing. Sequence reads can be obtained by various methods known in the art. For example, sequence reads may be obtained using a variety of methods, such as sequencing techniques, or using probes, such as in hybridization arrays or capture probes, or amplification techniques, such as the polymerase chain reaction (PCR) or It can be obtained in linear or isothermal amplification using a single primer.

本明細書で使用する「リードセグメント」または「リード」という用語は、対象から得られた配列リードおよび/またはサンプルの初期配列リードに由来するヌクレオチド配列を含む、任意のヌクレオチド配列を指す。例えば、リードセグメントは、アライメントされた配列リード、コラプスされた配列リード(collapsed sequence read)、またはスティッチされたリード(stitched read)を指すことができる。さらに、リードセグメントは、単一ヌクレオチドバリアントなど、個々のヌクレオチド塩基を指すこともできる。 The term "read segment" or "read" as used herein refers to any nucleotide sequence, including nucleotide sequences derived from sequence reads obtained from a subject and/or initial sequence reads of a sample. For example, read segments can refer to aligned sequence reads, collapsed sequence reads, or stitched reads. Furthermore, a lead segment can refer to individual nucleotide bases, such as single nucleotide variants.

本明細書で使用する「濃縮する」という用語は、サンプル中の1つ以上の標的核酸の割合を増加させることを意味する。「濃縮された」サンプルまたはシーケンシングライブラリは、したがって、サンプル中の非標的核酸に対して1つ以上の標的核酸の割合が増加したサンプルまたはシーケンシングライブラリのことである。 As used herein, the term "enriching" means increasing the proportion of one or more target nucleic acids in a sample. An "enriched" sample or sequencing library is therefore a sample or sequencing library that has an increased proportion of one or more target nucleic acids relative to non-target nucleic acids in the sample.

一般に、ポリヌクレオチドに適用される「無細胞」、「循環」、および「細胞外」という用語(例えば、「無細胞RNA」および「無細胞DNA」)は、対象またはその一部からのサンプル中に存在し、(例えば、細胞またはウイルスからの抽出のための溶解のように)最初に採取されたサンプルに溶解ステップを適用することなく単離または他の方法で操作することができるポリヌクレオチドを指すために互換的に使用される。したがって、無細胞ポリヌクレオチドは、対象のサンプルが採取される前であっても、カプセル化されていない、または由来する細胞またはウイルスから「遊離」している。無細胞ポリヌクレオチドは、細胞死(例えば、アポトーシスまたはネクローシス)または細胞脱落の副産物として生成され、ポリヌクレオチドを周囲の体液中や循環中に放出することがある。したがって、無細胞ポリヌクレオチドは、血液の非細胞フラクション(例えば、血清または血漿)、他の体液(例えば、尿)、または他の種類のサンプルの非細胞フラクションから単離することができる。「無細胞RNA」または「cfRNA」という用語は、対象の体内(例えば血流)を循環するリボ核酸断片を指し、1つ以上の健常細胞および/または1つ以上の癌細胞に由来する可能性がある。同様に、「無細胞DNA」または「cfDNA」とは、対象の体内(例えば血流)を循環するデオキシリボ核酸分子を指し、1つ以上の健常細胞および/または1つ以上の癌細胞に由来する可能性がある。 Generally, the terms “cell-free,” “circulating,” and “extracellular” as applied to polynucleotides (e.g., “cell-free RNA” and “cell-free DNA”) refer to and can be isolated or otherwise manipulated without applying a lysis step to the sample originally taken (e.g., lysis for extraction from cells or viruses). Used interchangeably to refer to Thus, cell-free polynucleotides are "free" from the cells or viruses from which they were not encapsulated or from which they were derived, even before the subject's sample is taken. Cell-free polynucleotides may be produced as a by-product of cell death (eg, apoptosis or necrosis) or cell shedding, releasing polynucleotides into the surrounding body fluids and circulation. Thus, cell-free polynucleotides can be isolated from acellular fractions of blood (eg, serum or plasma), other bodily fluids (eg, urine), or other types of samples. The term "cell-free RNA" or "cfRNA" refers to ribonucleic acid fragments that circulate in a subject's body (e.g., the bloodstream) and may be derived from one or more healthy cells and/or one or more cancer cells. There is Similarly, "cell-free DNA" or "cfDNA" refers to deoxyribonucleic acid molecules that circulate in a subject's body (e.g., the bloodstream) and are derived from one or more healthy cells and/or one or more cancer cells. there is a possibility.

「循環腫瘍RNA」または「ctRNA」という用語は、腫瘍細胞または他の種類の癌細胞に由来するリボ核酸断片を指し、瀕死の細胞のアポトーシスまたはネクローシスなどの生物学的プロセスの結果として対象の身体(例えば、血流)に放出されるか、または生存腫瘍細胞によって活発に放出されることがある。 The term "circulating tumor RNA" or "ctRNA" refers to ribonucleic acid fragments derived from tumor cells or other types of cancer cells, which are induced in the body of a subject as a result of biological processes such as apoptosis or necrosis of dying cells. It may be released (eg, into the bloodstream) or actively released by viable tumor cells.

本明細書で使用する「ダークチャネルRNA」または「ダークチャネルcfRNA分子」または「ダークチャネル遺伝子」という用語は、健常細胞での発現量が非常に少ないか存在しないRNA分子または遺伝子を指す。したがって、ダークチャネルRNA(cfRNA)分子の同定、検出、および/または定量化は、癌などの疾患状態の評価において、シグナル対ノイズ比を改善し、感度および特異性を向上させることができる。 The term "dark channel RNA" or "dark channel cfRNA molecule" or "dark channel gene" as used herein refers to an RNA molecule or gene that is very poorly expressed or absent in healthy cells. Accordingly, identification, detection and/or quantification of dark channel RNA (cfRNA) molecules can improve signal-to-noise ratios and increase sensitivity and specificity in assessing disease states such as cancer.

本明細書で使用する「処置する」または「処置」は、臨床結果を含む、対象の状態において有益または所望の結果を得るための任意のアプローチを含む。有益または所望の臨床結果には、部分または全体、検出可能または検出不可能を問わず、1つ以上の症状または状態の緩和または改善、疾患の範囲の減少、疾患の状態の安定化(すなわち、悪化させない)、疾患の伝達または拡大の防止、疾患の進行の遅延または減速、疾患状態の改善または緩和、疾患の再発の減少、および寛解が含まれるが、これらに限定されない。すなわち、本明細書で使用する「処置」には、疾患の治癒、改善、または予防のいずれもが含まれる。処置は、疾患の発生を防ぐ、疾患の広がりを抑制する、疾患の症状を和らげる、疾患の根本原因を完全にまたは部分的に取り除く、疾患の期間を短縮する、またはこれらの組み合わせを行う場合がある。 As used herein, "treating" or "treatment" includes any approach for obtaining beneficial or desired results in a subject condition, including clinical results. Beneficial or desired clinical results include partial or total, detectable or undetectable, alleviation or amelioration of one or more symptoms or conditions, reduction of disease extent, stabilization of disease state (i.e., preventing disease transmission or spread, slowing or slowing disease progression, ameliorating or alleviating disease state, reducing disease recurrence, and remission. Thus, "treatment" as used herein includes any cure, amelioration, or prevention of disease. Treatment may prevent the disease from occurring, limit the spread of the disease, relieve the symptoms of the disease, completely or partially eliminate the underlying cause of the disease, shorten the duration of the disease, or any combination thereof. be.

本明細書で使用する「処置する」および「処置」には、予防的処置が含まれる。処置方法は、治療有効量の活性剤を対象に投与することを含む。投与ステップは、1回の投与で構成される場合もあれば、一連の投与を含む場合もある。処置期間の長さは、状態の重篤度、患者の年齢、活性剤の濃度、処置に使用する組成物の活性、またはそれらの組み合わせなど、さまざまな要因に依存する。また、処置または予防に使用される薬剤の有効用量は、特定の処置または予防計画の過程で増加または減少し得ることも理解されよう。用量の変化が生じ、当該技術分野で知られている標準的な診断アッセイによって明らかになる可能性がある。場合によっては、長期投与が必要な場合もある。例えば、組成物は、患者を処置するのに十分な量および期間で対象に投与される。実施形態において、処置することまたは処置は予防的処置ではない。 As used herein, "treat" and "treatment" include prophylactic treatment. Treatment methods include administering to a subject a therapeutically effective amount of an active agent. An administering step may consist of a single administration or may comprise a series of administrations. The length of treatment will depend on a variety of factors, including the severity of the condition, age of the patient, concentration of active agent, activity of the composition used for treatment, or a combination thereof. It will also be appreciated that the effective dose of an agent used for treatment or prevention may increase or decrease over the course of a particular treatment or prevention regimen. Changes in dosage may occur and become apparent by standard diagnostic assays known in the art. Long-term administration may be necessary in some cases. For example, the composition is administered to the subject in an amount and for a period of time sufficient to treat the patient. In embodiments, treating or treatment is not prophylactic treatment.

対象の疾患または状態に関する用語「予防する」は、対象の1つ以上の対応する症状の発生を減少させることを意味する。上記に示したように、予防は完全なもの(検出可能な症状がない)であっても、部分的なものであってもよく、例えば、処置を行わない場合に起こりうる症状よりも少ない症状が観察される、および/または低い発生率である。 The term "prevent," in reference to a disease or condition in a subject, means reducing the occurrence of one or more corresponding symptoms in the subject. As indicated above, prevention can be complete (no detectable symptoms) or partial, e.g., fewer symptoms than would otherwise occur. are observed and/or have a low incidence.

「抗癌剤(Anti-cancer agent)」および「抗癌剤(anticancer agent)」は、その明白な通常の意味に従って使用され、抗腫瘍特性または細胞の成長もしくは増殖を阻害する能力を有する組成物(例えば、化合物、薬物、アンタゴニスト、阻害剤、調節因子)を指す。いくつかの実施形態において、抗癌剤は化学療法剤である。いくつかの実施形態において、抗癌剤は、癌を処置する方法において有用性を有する、本明細書において特定される薬剤である。いくつかの実施形態において、抗癌剤は、癌の処置のためにFDAまたは米国以外の国の同様の規制当局によって承認された薬剤である。抗癌剤の例としては、限定されるものではないが、MEK(例えば、MEK1、MEK2、またはMEK1とMEK2)阻害剤(例えば、XL518、CI-1040、PD035901、セルメチニブ/AZD6244、GSK1120212/トラメチニブ、GDC-0973、ARRY-162、ARRY-300、AZD8330、PD0325901、U0126、PD98059、TAK-733、PD318088、AS703026、BAY 869766)、アルキル化剤(例えば、シクロホスファミド、イホスファミド、クロランブシル、ブスルファン、メルファラン、メクロレタミン、ウラムスチン、チオテパ、ニトロソウレア、ナイトロジェンマスタード(例えば、メクロロエタミン、シクロホスファミド、クロランブシル、メイファラン)、エチレンイミンおよびメチルメラミン(例えば、ヘキサメチルメラミン、チオテパ)、アルキルスルホネート(例えば、ブスルファン)、ニトロソウレア(例えば、カルムスチン、ロムシチン、セムスチン、ストレプトゾシン)、トリアゼン(デカルバジン))、代謝拮抗物質(例えば、5-アザチオプリン、ロイコボリン、カペシタビン、フルダラビン、ゲムシタビン、ペメトレキセド、ラルチトレキセド、葉酸類似体(例えば、メトトレキサート)、またはピリミジン類似体(例えば、フルオロウラシル、フロクスウリジン、シタラビン)、プリン類似体(例えば、メルカプトプリン、チオグアニン、ペントスタチン)など)、植物アルカロイド(例えば、ビンクリスチン、ビンブラスチン、ビノレルビン、ビンデシン、ポドフィロトキシン、パクリタキセル、ドセタキセルなど)、トポイソメラーゼ阻害剤(例えば、イリノテカン、トポテカン、アムサクリン、エトポシド(VP16)、リン酸エトポシド、テニポシドなど)、抗腫瘍抗生物質(例えば、ドキソルビシン、アドリアマイシン、ダウノルビシン、エピルビシン、アクチノマイシン、ブレオマイシン、マイトマイシン、ミトキサントロン、プリカマイシンなど)、白金ベースの化合物(例えば、シスプラチン、オキサロプラチン、カルボプラチン)、アントラセンジオン(例えば、ミトキサントロン)、置換尿素(例えば、ヒドロキシ尿素)、メチルヒドラジン誘導体(例えば、プロカルバジン)、副腎皮質抑制剤(例えば、ミトタン、アミノグルテチミド)、エピポドフィロトキシン(例えば、エトポシド)、抗生物質(例えば、ダウノルビシン、ドキソルビシン、ブレオマイシン)、酵素(例えば、L-アスパラギナーゼ)、マイトジェン活性化プロテインキナーゼシグナル伝達の阻害剤(例えば、U0126、PD98059、PD184352、PD0325901、ARRY-142886、SB239063、SP600125、BAY 43-9006、ワートマニン、またはLY294002、Syk阻害剤、mTOR阻害剤、抗体(例えば、リツキサン)、ゴシホール、ゲナセンス、ポリフェノールE、クロロフシン、オールトランス-レチノイン酸(ATRA)、ブリオスタチン、腫瘍壊死因子関連アポトーシス誘導リガンド(TRAIL)、5-アザ-2’-デオキシシチジン、オールトランスレチノイン酸、ドキソルビシン、ビンクリスチン、エトポシド、ゲムシタビン、イマチニブ(Gleevec(登録商標))、ゲルダナマイシン、17-N-アリルアミノ-17-デメトキシゲルダナマイシン(17-AAG)、フラボピリドール、LY294002、ボルテゾミブ、トラスツズマブ、BAY 11-7082、PKC412、PD184352、20-epi-1、25 ジヒドロキシビタミンD3;5-エチニルウラシル;アビラテロン;アクラルビシン;アシルフルベン;アデシペノール;アドゼレシン;アルデスロイキン;ALL-TK アンタゴニスト;アルトレタミン;アンバムスチン;アミドックス;アミホスチン;アミノレブリン酸;アムルビシン;アムサクリン;アナグレリド;アナストロゾール;アンドログラホリド;血管新生阻害剤;アンタゴニストD;アンタゴニストG;アンタレリクス;抗背側化形態形成タンパク質-1(anti-dorsalizing morphogenetic protein-1);抗アンドロゲン、前立腺癌;抗エストロゲン;抗腫瘍剤;アンチセンスオリゴヌクレオチド;アフィジコリングリシネート;アポトーシス遺伝子調節因子;アポトーシス調節因子;アプリン酸;ara-CDP-DL-PTBA;アルギニンデアミナーゼ;アスラクリン;アタメスタン;アトリムスチン;アキナスタチン1;アキナスタチン2;アキナスタチン3;アザセトロン;アザトキシン;アザチロシン;バッカチンIII誘導体;バラノール;バチマスタット;BCR/ABLアンタゴニスト;ベンゾクロリン;ベンゾイルスタウロスポリン;βラクタム誘導体;ベータアレチン;ベタクラマイシンB;ベツリン酸;bFGF阻害剤;ビカルタミド;ビサントレン;ビスジリジニルスペルミン;ビスナフィド;ビストラテンA;ビゼレシン;ブレフレート;ブロピリミン;ブドチタン;ブチオニンスルホキシイミン;カルシポトリオール;カルフォスチンC;カンプトテシン誘導体;canarypox IL-2;カペシタビン;カルボキサミド-アミノ-トリアゾール;カルボキシアミドトリアゾール;CaRest M3;CARN700;軟骨由来の阻害剤;カルゼレシン;カゼインキナーゼ阻害剤(ICOS);カスタノスペルミン;セクロピンB;セトロレリクス;クロリン;クロロキノキサリンスルホンアミド;シカプロスト;シスポルフィリン;クラドリビン;クロミフェン類似体;クロトリマゾール;コリスマイシンA;コリスマイシンB;コンブレタスタチンA4;コンブレタスタチン類似体;コナゲニン;クランベシジン816;クリスナトール;クリプトフィシン8;クリプトフィシンA誘導体;キュラシンA;シクロペンタントラキノン類;シクロプラタム;シペマイシン;オクホス酸シタラビン;細胞溶解因子;サイトスタチン;ダクリキシマブ;デシタビン;デヒドロジデムニンB;デスロレリン;デキサメタゾン;デキシホスファミド;デクスラゾキサン;デクスベラパミル;ジアジクオン;ディデムニンB;ディドックス;ジエチルノルスペルミン;ジヒドロ-5-アザシチジン;9-ジオキサマイシン;ジフェニルスピロムスチン;ドコサノール;ドラセトロン;ドキシフルリジン;ドロロキシフェン;ドロナビノール;デュオカルマイシンSA;エブセレン;エコムスチン;エデルホシン;エドレコロマブ;エフロルニチン;エレメン;エミテファー;エピルビシン;エプリステリド;エストラムスチン類似体;エストロゲンアゴニスト;エストロゲンアンタゴニスト;エタニダゾール;エトポシドリン酸塩;エキセメスタン;ファドロゾール;ファザラビン;フェンレチニド;フィルグラスチム;フィナステリド;フラボピリドール;フレゼラスチン;フルステロン;フルダラビン;フルオロダウノルニシン塩酸塩;フォルフェニメックス;フォルメスタン;フォストリエシン;フォテムスチン;ガドリニウムテキサフィリン;硝酸ガリウム;ガロシタビン;ガニレリクス;ゼラチナーゼ阻害剤;ゲムシタビン;グルタチオン阻害剤;ヘプスルファム;ヒレグリン;ヘキサメチレンビスアセトアミド;ヒペリシン;イバンドロン酸;イダルビシン;イドキシフェン;イドラマントン;イルモホシン;イロマスタット;イミダゾアクリドン;イミキモド;免疫刺激ペプチド;インスリン様成長因子-1受容体阻害剤;インターフェロンアゴニスト;インターフェロン;インターロイキン;イオベングアン;ヨードドキソルビシン;イポメアノール、4-;イロプラクト;イルソグラジン;イソベンガゾール;イソホモハリコドリンB;イタセトロン;ジャスプラキノリド;カハラリドF;ラメラリン-N トリアセテート;ランレオチド;レイナマイシン;レノグラスチム;硫酸レンチナン;レプトルスタチン;レトロゾール;白血病阻害因子;白血球αインターフェロン;ロイプロリド+エストロゲン+プロゲステロン;リュープロレリン;レバミゾール;リアロゾール;直鎖状ポリアミン類似体;親油性二糖ペプチド;親油性白金化合物;リソクリンアミド7;ロバプラチン;ロンブリシン;ロメトレキソール;ロニダミン;ロソキサントロン;ロバスタチン;ロキソリビン;ルルトテカン;ルテチウムテキサフィリン;リソフィリン;溶解ペプチド(lytic peptides);マイタンシン;マノスタチンA;マリマスタット;マソプロコル;マスピン;マトリライシン阻害剤;マトリックスメタロプロテイナーゼ阻害剤;メノガリル;メルバローネ;メータレリン;メチオニナーゼ;メトクロプラミド;MIF阻害剤;ミフェプリストン;ミルテフォシン;ミリモスティム;ミスマッチ二本鎖RNA;ミトグアゾン;ミトラクトール;マイトマイシン類似体;ミトナフィド;マイトキシン線維芽細胞成長因子サポリン;ミトキサントロン;モファロテン;モルグラモスチム;モノクローナル抗体、ヒト絨毛性ゴナドトロフィン;モノホスホリルリピドA+myobacterium細胞壁sk;モピダモール;多剤耐性遺伝子阻害剤;multiple tumor suppressor 1ベースの治療;マスタード抗癌剤;マイカペルオキシドB;マイコバクテリア細胞壁抽出物;ミリアポロン;N-アセチルジナリン;N-置換ベンズアミド;ナファレリン;ナグレスティップ;ナロキソン+ペンタゾシン;ナパビン;ナフテルピン;ナルトグラスチム;ネダプラチン;ネモルビシン;ネリドロン酸;中性エンドペプチダーゼ;ニルタミド;ニサマイシン;一酸化窒素モジュレーター;ニトロキシド酸化防止剤;ニトルリン;O6-ベンジルグアニン;オクトレオチド;オキセノン;オリゴヌクレオチド;オナプリストン;オンダンセトロン;オンダンセトロン;オラシン;経口サイトカイン誘導剤;オルマプラチン;オサテロン;オキサリプラチン;オキサウノマイシン;パラウアミン;パルミトイルリゾキシン;パミドロン酸;パナキシトリオール;パノミフェン;パラバクチン;パゼリプチン;ペガスパルガス;ペルデシン;ペントサンポリ硫酸ナトリウム;ペントスタチン;ペントロゾール;パーフルブロン;ペルホスファミド;ペリリルアルコール;フェナジノマイシン;酢酸フェニル;ホスファターゼ阻害剤;ピシバニル;塩酸ピロカルピン;ピラルビシン;ピリトレキシム;プラセチンA;プラセチンB;プラスミノーゲンアクチベーター阻害剤;白金錯体;白金化合物;白金トリアミン錯体;ポルフィマーナトリウム;ポルフィロマイシン;プレドニン;プロピルビスアクリドン;プロスタグランジンJ2;プロテアソーム阻害剤;プロテインAベースの免疫調節剤;プロテインキナーゼC阻害剤;プロテインキナーゼC阻害剤、微細藻類;プロテインチロシンホスファターゼ阻害剤;プリンヌクレオシドホスホリラーゼ阻害剤;プルプリン;ピラゾロアクリジン;ピリドキシル化ヘモグロビンポリオキシエチレン結合体;rafアンタゴニスト;ラルチトレキセド;ラモセトロン;ラスファルネシルタンパク質トランスフェラーゼ阻害剤;ras阻害剤;ras-GAP阻害剤;脱メチル化レテリプチン;レニウムRe 186エチドロネート;リゾキシン;リボザイム;RIIレチンアミド;ログレチミド;ロヒツキネ;ロムルティド;ロキニメックス;ルビギノンB1;ルボキシル;サフィンゴール;セントピン;SarCNU;サルコフィトールA;サルグラモスチム;Sdi 1模倣物;セムスチン;
老化由来阻害剤1(senescence derived inhibitor 1);センスオリゴヌクレオチド;シグナル伝達阻害剤;シグナル伝達モジュレーター;単鎖抗原結合タンパク質;シゾフラン;ソブゾキサン;ボロカプト酸ナトリウム;フェニル酢酸ナトリウム;ソルベロール;ソマトメジン結合タンパク質;ソナーミン;スパルホン酸;スピカマイシンD;スピロムスチン;スプレノペンチン;スポンジスタチン1;スクアラミン;幹細胞阻害剤;幹細胞***阻害剤;スチピアミド;ストロメライシン阻害剤;スルフィノシン;超活性型血管作用性小腸ペプチドアンタゴニスト(superactive vasoactive intestinal peptide antagonist);スラディスタ;スラミン;スワインソニン;合成グリコサミノグリカン;タリムスチン;タモキシフェンメチオジド;タウロムスチン;タザロテン;テコガランナトリウム;テガフール;テルラピリリウム;テロメラーゼ阻害剤;テモポルフィン;テモゾロミド;テニポシド;テトラクロロデカオキシド;テトラゾミン;サリブラスチン;チオコラリン;トロンボポエチン;トロンボポエチン模倣物;チマルファシン;チモポエチン受容体アゴニスト;チモトリナン;甲状腺刺激ホルモン;スズエチルエチオプルプリン;チラパザミン;二塩化チタノセン;トップセンチン;トレミフェン;全能性幹細胞因子;翻訳阻害剤;トレチノイン;トリアセチルウリジン;トリシリビン;トリメトレキサート;トリプトレリン;トロピセトロン;ツロステリド;チロシンキナーゼ阻害剤;チルフォスチン;UBC阻害剤;ウベニメクス;泌尿生殖洞由来成長阻害因子;ウロキナーゼ受容体アンタゴニスト;バプレオチド;バリオリンB;ベクターシステム、赤血球遺伝子治療;ベラレソル;ベラミン;ヴァーディン;ベルテポルフィン;ビノレルビン;ビンキサルチン;ビタキシン;ボロゾール;ザノテロン;ゼニプラチン;ジラスコルブ;ジノスタチンスチマラマー、アドリアマイシン、ダクチノマイシン、ブレオマイシン、ビンブラスチン、シスプラチン、アシビシン;アクラルビシン;アコダゾール塩酸塩;アクロニン;アドゼレシン;アルデスロイキン;アルトレタミン;アンボマイシン;酢酸アメタントロン;アミノグルテチミド;アムサクリン;アナストロゾール;アントラマイシン;アスパラギナーゼ;アスパーリン;アザシチジン;アゼテパ;アゾトマイシン;バチマスタット;ベンゾデパ;ビカルタミド;ビサントレン塩酸塩;ジメシル酸ビスナフィド;ビゼレシン;硫酸ブレオマイシン;ブレキナールナトリウム;ブロピリミン;ブスルファン;カクチノマイシン;カルステロン;カラセミド;カルベタイマー;カルボプラチン;カルムスチン;塩酸カルビシン;カルゼレシン;セデフィンゴル;クロラムブシル;シロレマイシン;クラドリビン;メシル酸クリスナトール;シクロホスファミド;シタラビン;ダカルバジン;ダウノルビシン塩酸塩;デシタビン;デキソルマプラチン;デザグアニン;メシル酸デザグアニン;ジアジクオン;ドキソルビシン;塩酸ドキソルビシン;ドロロキシフェン;クエン酸ドロロキシフェン;プロピオン酸ドロモスタノロン;デュアゾマイシン;エダトレキサート;エフロルニチン塩酸塩;エルサミトルシン;エンロプラチン;エンプロマート;エピプロピジン;エピルビシン塩酸塩;エルブロゾール;エソルビシン塩酸塩;エストラムスチン;エストラムスチンリン酸ナトリウム;エタニダゾール;エトポシド;エトポシドリン酸塩;エトプリン;ファドロゾール塩酸塩;ファザラビン;フェンレチニド;フロクスウリジン;リン酸フルダラビン;フルオロウラシル;フルオロシタビン;フォスキドン;フォストリエシンナトリウム;ゲムシタビン;ゲムシタビン塩酸塩;ヒドロキシ尿素;イダルビシン塩酸塩;イホスファミド;イモホシン;インターロイキンI1(組換えインターロイキンII、またはrIL.sub.2を含む)、インターフェロンα-2a;インターフェロンアルファ-2b;インターフェロンアルファ-n1;インターフェロンアルファ-n3;インターフェロンβ-1a;インターフェロンガンマ-1b;イプロプラチン;イリノテカン塩酸塩;ランレオチド酢酸塩;レトロゾール;酢酸ロイプロリド;リアロゾール塩酸塩;ロメトレキソールナトリウム;ロムスチン;ロソキサントロン塩酸塩;マソプロコル;メイタンシン;メクロレタミン塩酸塩;酢酸メゲストロール;酢酸メレンゲストロール;メルファラン;メノガリル;メルカプトプリン;メトトレキサート;メトトレキサートナトリウム;メトプリン;メトレデパ;ミチンドマイド;ミトカルシン;ミトクロミン;マイトギリン;ミトマルシン;マイトマイシン;ミトスパー;ミトタン;ミトキサントロン塩酸塩;ミコフェノール酸;ノコダゾイエ;ノガラマイシン;オルマプラチン;オキシスラン;ペガスパルガス;ペリオマイシン;ペンタムスチン;硫酸ペプロマイシン;ペルホスファミド;ピポブロマン;ピポスルファン;ピロキサントロン塩酸塩;プリカマイシン;プロメスタン;ポルフィマーナトリウム;ポルフィロマイシン;プレドニムスチン;プロカルバジン塩酸塩;ピューロマイシン;ピューロマイシン塩酸塩;ピラゾフリン;リボプリン;ログレチミド;サフィンゴール;サフィンゴール塩酸塩;セムスチン;シムトラゼン;スパルホサートナトリウム;スパーソマイシン;スピロゲルマニウム塩酸塩;スピロムスチン;スピロプラチン;ストレプトニグリン;ストレプトゾシン;スロフェヌール;タリソマイシン;テコガランナトリウム;テガフール;塩酸テロキサントロン;テモポルフィン;テニポシド;テロキシロン;テストラクトン;チアミプリン;チオグアニン;チオテパ;チアゾフリン;チラパザミン;クエン酸トレミフェン;酢酸トレストン;リン酸トリシリビン;トリメトレキサート;グルクロン酸トリメトレキサート;トリプトレリン;チューブロゾール塩酸塩;ウラシルマスタード;ウレデパ;バプレオチド;ベルテポルフィン;硫酸ビンブラスチン;硫酸ビンクリスチン;ビンデシン;硫酸ビンデシン;硫酸ビネピジン;硫酸ビングリシネート;硫酸ビンロイロシン;酒石酸ビノレルビン;硫酸ビンロシジン;硫酸ビンゾリジン;ボロゾール;ゼニプラチン;ジノスタチン;ゾルビシン塩酸塩、G2-M期の細胞を停止させ、および/または微小管の形成もしくは安定性を調節する薬剤(例えば、Taxol(商標)(すなわち、パクリタキセル)、タキソテール(商標)、タキサン骨格を含む化合物、エルブロゾール(すなわち、R-55104)、ドラスタチン10(すなわち、DLS-10およびNSC-376128)、ミボブリンイセチオン酸塩(すなわち、CI-980として)、ビンクリスチン、NSC-639829、ディスコデルモライド(すなわち、NVP-XX-A-296として)、ABT-751(アボット、すなわちE-7010)、アルトヒルチン(例えば、アルトヒルチンAおよびアルトヒルチンC)、スポンジスタチン(例えば、スポンジスタチン1、スポンジスタチン2、スポンジスタチン3、スポンジスタチン4、スポンジスタチン5、スポンジスタチン6、スポンジスタチン7、スポンジスタチン8、およびスポンジスタチン9)、塩酸セマドチン(LU-103793およびNSC-D-669356)、エポチロン(エポチロンA、エポチロンB、エポチロンC(デスオキシエポチロンAまたはdEpoAなど)、エポチロンD(KOS-862、dEpoB、デスオキシエポチロンBなど)、エポチロン)E、エポチロンF、エポチロンB N-オキシド、エポチロンA N-オキシド、16-アザ-エポチロンB、21-アミノエポチロンB(すなわちBMS-310705)、21-ヒドロキシエポチロンD(すなわち、デソキシエポチロンFおよびdEpoF)、26-フルオロエポチロン、オーリスタチンPE(すなわちNSC-654663)、ソブリドチン(すなわちTZT-1027)、LS-4559-P(ファルマシア、すなわちLS-4577)、LS-4578(ファルマシア、すなわちLS-477-P)、LS-4477(ファルマシア)、LS-4559(ファルマシア)、RPR-112378(アベンティス)、硫酸ビンクリスチン、DZ-3358(ダイイチ)、FR-182877(藤沢、つまりWS-9885B)、GS-164(武田)、GS-198(武田)、KAR-2(ハンガリー科学アカデミー)、BSF-223651(BASF、すなわちILX-651およびLU-223651))、SAH-49960(リリー/ノバルティス)、SDZ-268970(リリー/ノバルティス)、AM-97(Armad/協和発酵)、AM-132(アルマド)、AM-138(アルマド/協和発酵)、IDN-5005(インデナ)、クリプトフィシン52(すなわちLY-355703)、AC-7739(味の素、すなわちAVE-8063AおよびCS-39.HCl)、AC-7700(味の素、すなわちAVE-8062、AVE-8062A、CS-39-L-Ser.HCl、およびRPR-258062A)、ビチレブアミド、ツブリシンA、カナデンソール、センタウレイジン(すなわちNSC-106969)、T-138067(トゥラリック、すなわちT-67、TL-138067およびTI-138067)、COBRA-1(パーカーヒューズ研究所、すなわちDDE-261およびWHI-261))、H10(カンザス州立大学)、H16(カンザス州立大学)、オンコシジンA1(すなわちBTO-956およびDIME)、DDE-313(パーカーヒューズ研究所)、フィジアノリドB、ラウリマライド、SPA-2(パーカーヒューズ研究所)、SPA-1(パーカーヒューズ研究所、すなわちSPIKET-P)、3-IAABU(細胞骨格/マウントシナイ医科大学、すなわちMF-569)、ナルコシン(NSC-5366としても知られる)、ナスカピン、D-24851(Asta Medica)、A-105972(Abbott)、ヘミアスターリン、3-BAABU(細胞骨格/マウントシナイ医科大学、すなわちMF-191)、TMPN(アリゾナ州立大学)、バナドセンアセチルアセトナート、T-138026(Tularik)、モンサトロール、ナノシン(すなわちNSC-698666)、3-IAABE(細胞骨格/マウントシナイ医科大学)、A-204197(アボット)、T-607(Tuiarik、すなわちT-900607)、RPR-115781(Aventis)、エリュテロビン(デスメチルエリュテロビン、デサエチルエリュテロビン、イソエリュテロビンA、およびZ-エリュテロビンなど)、カリバエオサイド、カリベエオリン、ハリコンドリンB、D-64131(Asta Medica)、D-68144(Asta Medica)、ジアゾナミドA、A-293620(アボット)、NPI-2350(ネレウス)、タカロノリドA、TUB-245(アベンティス)、A-259754(アボット)、ジオゾスタチン、(-)-フェニルヒスチン(すなわちNSCL-96F037)、D-68838(Asta Medica)、D-68836(Asta Medica)、ミオセベリンB、D-43411(ゼンタリス、すなわちD-81862)、A-289099(アボット)、A-318315(アボット)、HTI-286(すなわちSPA-110、トリフルオロ酢酸塩)(Wyeth)、D-82317(Zentaris)、D-82318(Zentaris)、SC-12983(NCI)、レスベラスタチンリン酸ナトリウム、BPR-OY-007(National Health Research Institutes)、およびSSR-250411(サノフィ))、ステロイド(例えば、デキサメタゾン)、フィナステリド、アロマターゼ阻害剤、ゴセレリンやロイプロリドなどのゴナドトロピン放出ホルモンアゴニスト(GnRH)、副腎皮質ステロイド(プレドニゾンなど)、プロゲスチン(例えば、カプロン酸ヒドロキシプロゲステロン、酢酸メゲストロール、
酢酸メドロキシプロゲステロン)、エストロゲン(例えば、ジエチルスチルベストロール、エチニルエストラジオール)、抗エストロゲン(例えば、タモキシフェン)、アンドロゲン(例えば、プロピオン酸テストステロン、フルオキシメステロン)、抗アンドロゲン(例えば、フルタミド)、免疫刺激薬(例えば、カルメットゲラン桿菌(BCG)、レバミゾール、インターロイキン-2、α-インターフェロンなど)、モノクローナル抗体(例えば、抗CD20、抗HER2、抗CD52、抗HLA-DR、抗VEGFモノクローナル抗体)、免疫毒素(例えば、抗CD33モノクローナル抗体-カリケアマイシンコンジュゲート、抗CD22モノクローナル抗体-シュードモナス外毒素コンジュゲートなど)、放射線免疫療法(例えば、111In、90Y、または131Iにコンジュゲートした抗CD20モノクローナル抗体など)、トリプトライド、ホモハリングトニン、ダクチノマイシン、ドキソルビシン、エピルビシン、トポテカン、イトラコナゾール、ビンデシン、セリバスタチン、ビンクリスチン、デオキシアデノシン、セルトラリン、ピタバスタチン、イリノテカン、クロファジミン、5-ノニルオキシトリプタミン、ベムラフェニブ、ダブラフェニブ、エルロチニブ、ゲフィチニブ、EGFR阻害剤、上皮成長因子受容体(EGFR)標的療法または治療薬(例えば、ゲフィチニブ(Iressa(商標))、エルロチニブ(Tarceva(商標))、セツキシマブ(Erbitux(商標))、ラパチニブ(Tykerb(商標))、パニツムマブ(Vectibix(商標))、バンデタニブ(Caprelsa(商標))、アファチニブ/BIBW2992、CI-1033/カネルチニブ、ネラチニブ/HKI-272、CP-724714、TAK-285、AST-1306、ARRY334543、ARRY-380、AG-1478、ダコミチニブ/PF299804、OSI-420/デスメチルエルロチニブ、AZD8931、AEE788、ペリチニブ/EKB-569、CUDC-101、WZ8040、WZ4002、WZ3146、AG-490、XL647、PD153035、BMS-599626)、ソラフェニブ、イマチニブ、スニチニブ、ダサチニブなどが挙げられる。
"Anti-cancer agent" and "anticancer agent" are used according to their plain and ordinary meaning and refer to a composition (e.g., compound , drugs, antagonists, inhibitors, modulators). In some embodiments, the anticancer agent is a chemotherapeutic agent. In some embodiments, the anticancer agent is an agent identified herein that has utility in methods of treating cancer. In some embodiments, the anti-cancer agent is an agent approved by the FDA or similar regulatory agency outside the United States for the treatment of cancer. Examples of anticancer agents include, but are not limited to, MEK (eg, MEK1, MEK2, or MEK1 and MEK2) inhibitors (eg, XL518, CI-1040, PD035901, selumetinib/AZD6244, GSK1120212/trametinib, GDC- 0973, ARRY-162, ARRY-300, AZD8330, PD0325901, U0126, PD98059, TAK-733, PD318088, AS703026, BAY 869766), alkylating agents (e.g. cyclophosphamide, ifosfamide, chlorambucil, busulfan, melphalan, mechlorethamine, uramustine, thiotepa, nitrosourea, nitrogen mustards (e.g. mechloroethamine, cyclophosphamide, chlorambucil, mayphalan), ethyleneimine and methylmelamine (e.g. hexamethylmelamine, thiotepa), alkylsulfonates (e.g. busulfan) , nitrosoureas (e.g. carmustine, lomustine, semustine, streptozocin), triazenes (decarbazine)), antimetabolites (e.g. 5-azathioprine, leucovorin, capecitabine, fludarabine, gemcitabine, pemetrexed, raltitrexed, folic acid analogues (e.g. methotrexate), or pyrimidine analogues (e.g. fluorouracil, floxuridine, cytarabine), purine analogues (e.g. mercaptopurine, thioguanine, pentostatin), plant alkaloids (e.g. vincristine, vinblastine, vinorelbine, vindesine, dophyllotoxin, paclitaxel, docetaxel, etc.), topoisomerase inhibitors (e.g., irinotecan, topotecan, amsacrine, etoposide (VP16), etoposide phosphate, teniposide, etc.), antitumor antibiotics (e.g., doxorubicin, adriamycin, daunorubicin, epirubicin, actinomycin, bleomycin, mitomycin, mitoxantrone, plicamycin, etc.), platinum-based compounds (e.g., cisplatin, oxaloplatin, carboplatin), anthracenediones (e.g., mitoxantrone), substituted ureas (e.g., hydroxyurea), Methylhydrazine derivatives (e.g. procarbazine), adrenocortical inhibitors (e.g. mitotane, aminoglutethimide), epipodophyllotoxins (e.g. etoposide), antibiotics (e.g. daunorubicin, doxorubicin, bleomycin), enzymes (e.g. , L-asparaginase), inhibitors of mitogen-activated protein kinase signaling (e.g. U0126, PD98059, PD184352, PD0325901, ARRY-142886, SB239063, SP600125, BAY 43-9006, wortmannin, or LY294002, Syk inhibitor, mTOR inhibitors, antibodies (eg Rituxan), gossyphor, genacense, polyphenol E, chlorofucin, all-trans-retinoic acid (ATRA), bryostatin, tumor necrosis factor-related apoptosis-inducing ligand (TRAIL), 5-aza-2'-deoxy Cytidine, all-trans retinoic acid, doxorubicin, vincristine, etoposide, gemcitabine, imatinib (Gleevec®), geldanamycin, 17-N-allylamino-17-demethoxygeldanamycin (17-AAG), flavopiridol , LY294002, bortezomib, trastuzumab, BAY 11-7082, PKC412, PD184352, 20-epi-1, 25 dihydroxyvitamin D3; 5-ethynyluracil; abiraterone; aclarubicin; Aminolevulinic acid; Amrubicin; Amsacrine; Anagrelide; Anastrozole; Andrographolide; -dorsalizing morphogenetic protein-1); antiandrogen, prostate cancer; antiestrogen; antineoplastic agent; antisense oligonucleotide; aphidicolin glycinate; Aquinastatin 3; Azacetron; Azatoxin; Azatyrosine; Baccatin III derivatives; Balanol; Batimastat; BCR/ABL antagonists; β-Lactam Derivatives; Betaaretin; Betaclamycin B; Betulinic Acid; bFGF Inhibitors; Bicalutamide; calphostin C; camptothecin derivatives; canarypox IL-2; capecitabine; carboxamide-amino-triazole; carboxamidotriazole; chlorinoxaline sulfonamide; cicaprost; cisporphyrin; cladribine; clomiphene analogs; clotrimazole; Cryptophycin 8; Cryptophycin A derivatives; Curacin A; Cyclopentanetraquinones; Cycloplatam; dexrazoxane; dexverapamil; diaziquone; didemnin B; didox; diethylnorspermine; dihydro-5-azacytidine; Carmycin SA; Ebselen; Ecomustine; Edelfosine; Edrecolomab; Eflornithine; fluorodaunornisin hydrochloride; forfenimex; formestane; fostriecin; fotemustine; gadolinium texaphyrin; gallium nitrate; glutathione inhibitors; hepsulfame; hillegulin; hexamethylenebisacetamide; hypericin; ibandronic acid; idarubicin; iododoxorubicin; ipomeanol, 4-; ilopract; irsogladine; isobengazole; leukocyte alpha interferon; leuprolide + estrogen + progesterone; leuprorelin; levamisole; liarozole; linear polyamine analogs; lysoclinamide 7; donkeyplatin; lombricin; lometrexol; lonidamine; losoxantrone; lovastatin; loxoribine; matrilysin inhibitor; matrix metalloproteinase inhibitor; menogalil; melvalone; metarelin; methioninase; metoclopramide; toxin fibroblast growth factor saporin; mitoxantrone; mofarotene; molgramostim; monoclonal antibody, human chorionic gonadotrophin; monophosphoryl lipid A + myobacterium cell wall sk; N-acetyldinaline; N-substituted benzamides; Nafarelin; Nagrestip; Naloxone + Pentazocine; Napavine; Naphterpine; nitric oxide modulators; nitroxide antioxidants; nitrulline; O6-benzylguanine; octreotide; oxenone; Oxaunomycin; Palauamine; Palmitoylrhizoxin; Pamidronic acid; Panaxytriol; Panomiphene; Parabactin; Phosphatase inhibitors; picivanil; pilocarpine hydrochloride; pirarubicin; pyritrexime; placetin A; placetin B; Proteasome inhibitors; Protein A-based immunomodulators; Protein kinase C inhibitors; Protein kinase C inhibitors, microalgae; Protein tyrosine phosphatase inhibitors; purine nucleoside phosphorylase inhibitor; purpurin; pyrazoloacridine; pyridoxylated hemoglobin polyoxyethylene conjugate; raf antagonist; Rhenium Re 186 etidronate; Rizoxin; Ribozyme; RII Retinamide; Loggretimide;
senescence derived inhibitor 1; sense oligonucleotides; signaling inhibitors; signaling modulators; single-chain antigen binding proteins; spiromustine; sprenopentine; spongestatin 1; squalamine; stem cell inhibitor; stem cell division inhibitor; vasoactive intestinal peptide antagonists); Sladista; suramin; swainsonine; synthetic glycosaminoglycans; thrombopoietin; thrombopoietin mimetics; thymalfasin; thymopoietin receptor agonists; thymotrinan; thyroid-stimulating hormone; tretinoin; triacetyluridine; triciribine; trimetrexate; triptorelin; tropisetron; vapreotide; variolin B; vector system, erythrocyte gene therapy; veraresol; veramine; verdin; bleomycin, vinblastine, cisplatin, acibicin; aclarubicin; acodazole hydrochloride; acronin; bisantrene hydrochloride; bisnafide dimesylate; vizelesin; bleomycin sulfate; brequinal sodium; bropirimin; cytarabine; dacarbazine; daunorubicin hydrochloride; decitabine; dexorumaplatin; dezaguanine; droloxifene citrate; dromostanolone propionate; duazomycin; edatrexate; Ethanidazole; Etoposide; Etoposide Phosphate; Etoprine; Fadrozole Hydrochloride; Ifosfamide; Imofosine; Interleukin I1 (recombinant Interleukin II, or rIL. sub. 2), interferon alpha-2a; interferon alpha-2b; interferon alpha-n1; interferon alpha-n3; interferon beta-1a; interferon gamma-1b; liarozole hydrochloride; lometrexol sodium; lomustine; losoxantrone hydrochloride; masoprocol; maytansine; mechlorethamine hydrochloride; megestrol acetate; Mitindomide; Mitocalcin; Mitocromin; Mitogillin; Mitomarcin; Mitomycin; Mitospar; Piroxantrone Hydrochloride; Plicamycin; Promestane; Porfimer Sodium; Porphyromycin; Prednimustine; Procarbazine Hydrochloride; sparuphosate sodium; spasomycin; spirogermanium hydrochloride; spiromustine; spiroplatin; streptonigrin; streptozocin; thiamiprine; thioguanine; thiotepa; tiazofurine; tirapazamine; toremifene citrate; vinblastine sulfate; vincristine sulfate; vindesine; vindesine sulfate; vinepidine sulfate; and/or agents that modulate microtubule formation or stability (e.g., Taxol™ (i.e., paclitaxel), Taxotere™, compounds containing taxane scaffolds, elbrozol (i.e., R-55104), dolastatin 10 (i.e., DLS-10 and NSC-376128), mibobulin isethionate (i.e., as CI-980), vincristine, NSC-639829, discodermolide (i.e., as NVP-XX-A-296), ABT-751 (Abbott ie E-7010), althirtins (eg althirtin A and althirtin C), spongestatins (eg spongestatin 1, spongestatin 2, spongestatin 3, spongestatin 4, spongestatin 5, spongestatin) 6, spongestatin 7, spongestatin 8, and spongestatin 9), semadotin hydrochloride (LU-103793 and NSC-D-669356), epothilones (epothilone A, epothilone B, epothilone C (such as desoxyepothilone A or dEpoA), epothilone D (such as KOS-862, dEpoB, desoxyepothilone B), epothilone) E, epothilone F, epothilone B N-oxide, epothilone A N-oxide, 16-aza-epothilone B, 21-aminoepothilone B (i.e. BMS -310705), 21-hydroxyepothilone D (ie, desoxyepothilone F and dEpoF), 26-fluoroepothilone, auristatin PE (ie, NSC-654663), sobridotin (ie, TZT-1027), LS-4559-P (Pharmacia LS-4577), LS-4578 (Pharmacia, ie LS-477-P), LS-4477 (Pharmacia), LS-4559 (Pharmacia), RPR-112378 (Aventis), vincristine sulfate, DZ-3358 (Daiichi ), FR-182877 (Fujisawa, ie WS-9885B), GS-164 (Takeda), GS-198 (Takeda), KAR-2 (Hungarian Academy of Sciences), BSF-223651 (BASF, ie ILX-651 and LU- 223651)), SAH-49960 (Lilly/Novartis), SDZ-268970 (Lilly/Novartis), AM-97 (Armad/Kyowa Hakko), AM-132 (Armad), AM-138 (Armad/Kyowa Hakko), IDN -5005 (Indena), Cryptophycin 52 (ie LY-355703), AC-7739 (Ajinomoto ie AVE-8063A and CS-39. HCl), AC-7700 (Ajinomoto, i.e. AVE-8062, AVE-8062A, CS-39-L-Ser.HCl, and RPR-258062A), Vitirebamide, Tubulysin A, Canadenthol, Centaureaidin (i.e., NSC- 106969), T-138067 (Turalic i.e. T-67, TL-138067 and TI-138067), COBRA-1 (Parker Hughes Laboratories i.e. DDE-261 and WHI-261)), H10 (Kansas State University) , H16 (Kansas State University), Oncocidin A1 (i.e. BTO-956 and DIME), DDE-313 (Parker Hughes Laboratories), Physianolide B, Laurimalide, SPA-2 (Parker Hughes Laboratories), SPA-1 (Parker Hughes Laboratories) Institute, ie SPIKET-P), 3-IAABU (Cytoskeleton/Mount Sinai Medical College, ie MF-569), Narcosine (also known as NSC-5366), Nascapine, D-24851 (Asta Medica), A- 105972 (Abbott), Hemiasterlin, 3-BAABU (Cytoskeleton/Mount Sinai Medical College or MF-191), TMPN (Arizona State University), Vanadocene Acetylacetonate, T-138026 (Tularik), Monsatrol, Nanosyn (i.e. NSC-698666), 3-IAABE (Cytoskeleton/Mount Sinai School of Medicine), A-204197 (Abbott), T-607 (Tuiarik i.e. T-900607), RPR-115781 (Aventis), erythrobin (desmethyl erythrobin, desaethylerythrobin, isoerythrobin A, and Z-erythrobin), caribaeoside, caribeeorin, halichondrin B, D-64131 (Asta Medica), D-68144 (Asta Medica), diazonamide A, A-293620 (Abbott), NPI-2350 (Neleus), tacaronolide A, TUB-245 (Aventis), A-259754 (Abbott), diosostatin, (-)-phenylhistine (i.e., NSCL-96F037), D -68838 (Asta Medica), D-68836 (Asta Medica), Myoseverin B, D-43411 (Zentalis ie D-81862), A-289099 (Abbott), A-318315 (Abbott), HTI-286 (ie SPA -110, trifluoroacetate) (Wyeth), D-82317 (Zentaris), D-82318 (Zentaris), SC-12983 (NCI), resverastatin sodium phosphate, BPR-OY-007 (National Health Research Institutes) ), and SSR-250411 (Sanofi)), steroids (e.g., dexamethasone), finasteride, aromatase inhibitors, gonadotropin-releasing hormone agonists (GnRH) such as goserelin and leuprolide, corticosteroids (e.g., prednisone), progestins (e.g., capron). acid hydroxyprogesterone, megestrol acetate,
medroxyprogesterone acetate), estrogens (e.g. diethylstilbestrol, ethinyl estradiol), antiestrogens (e.g. tamoxifen), androgens (e.g. testosterone propionate, fluoxymesterone), antiandrogens (e.g. flutamide), immune stimulants (e.g., Bacillus Calmette-Guerin (BCG), levamisole, interleukin-2, α-interferon, etc.), monoclonal antibodies (e.g., anti-CD20, anti-HER2, anti-CD52, anti-HLA-DR, anti-VEGF monoclonal antibodies), Immunotoxins (eg, anti-CD33 monoclonal antibody-calicheamicin conjugates, anti-CD22 monoclonal antibody-Pseudomonas exotoxin conjugates, etc.), radioimmunotherapy (eg, anti-CD20 monoclonal antibodies conjugated to 111In, 90Y, or 131I, etc.) ), triptolide, homoharringtonine, dactinomycin, doxorubicin, epirubicin, topotecan, itraconazole, vindesine, cerivastatin, vincristine, deoxyadenosine, sertraline, pitavastatin, irinotecan, clofazimine, 5-nonyloxytryptamine, vemurafenib, dabrafenib, erlotinib, Gefitinib, EGFR inhibitors, epidermal growth factor receptor (EGFR) targeted therapies or therapeutics (e.g., gefitinib (Iressa™), erlotinib (Tarceva™), cetuximab (Erbitux™), lapatinib (Tykerb ( trademark)), panitumumab (Vectibix™), vandetanib (Caprelsa™), afatinib/BIBW2992, CI-1033/canertinib, neratinib/HKI-272, CP-724714, TAK-285, AST-1306, ARRY334543, ARRY-380, AG-1478, dacomitinib/PF299804, OSI-420/desmethylerlotinib, AZD8931, AEE788, peritinib/EKB-569, CUDC-101, WZ8040, WZ4002, WZ3146, AG-490, XL647, PD153 035, BMS- 599626), sorafenib, imatinib, sunitinib, dasatinib and the like.

本明細書で使用する「エピジェネティック阻害剤」とは、DNAメチル化(DNAメチル化阻害剤)またはヒストンの修飾(ヒストン修飾阻害剤)などのエピジェネティック過程の阻害剤を指す。エピジェネティック阻害剤は、ヒストン-脱アセチル化酵素(HDAC)阻害剤、DNAメチルトランスフェラーゼ(DNMT)阻害剤、ヒストンメチルトランスフェラーゼ(HMT)阻害剤、ヒストン脱メチル化酵素(HDM)阻害剤、またはヒストンアセチルトランスフェラーゼ(HAT)であり得る。HDAC阻害剤の例としては、ボリノスタット(Vorinostat)、ロミデプシン(romidepsin)、CI-994、ベリノスタット(Belinostat)、パノビノスタット(Panobinostat)、ジビノスタット(Givinostat)、エンチノスタット(Entinostat)、モセチノスタット(Mocetinostat)、SRT501、CUDC-101、JNJ-26481585、またはPCI24781が挙げられる。DNMT阻害剤の例としては、アザシチジンおよびデシタビンが挙げられる。HMT阻害剤の例としてはEPZ-5676が挙げられる。HDM阻害剤の例としては、パルギリンおよびトラニルシプロミンが挙げられる。HAT阻害剤の例としては、CCT077791およびガルシノールが挙げられる。 As used herein, "epigenetic inhibitors" refer to inhibitors of epigenetic processes such as DNA methylation (DNA methylation inhibitors) or histone modifications (histone modification inhibitors). Epigenetic inhibitors are histone-deacetylase (HDAC) inhibitors, DNA methyltransferase (DNMT) inhibitors, histone methyltransferase (HMT) inhibitors, histone demethylase (HDM) inhibitors, or histone acetylase (HDM) inhibitors. It can be a transferase (HAT). Examples of HDAC inhibitors include Vorinostat, Romidepsin, CI-994, Belinostat, Panobinostat, Givinostat, Entinostat, Mocetinostat ), SRT501 , CUDC-101, JNJ-26481585, or PCI24781. Examples of DNMT inhibitors include azacytidine and decitabine. Examples of HMT inhibitors include EPZ-5676. Examples of HDM inhibitors include pargyline and tranylcypromine. Examples of HAT inhibitors include CCT077791 and garcinol.

「マルチキナーゼ阻害剤」は、チロシンプロテインキナーゼおよびセリン/スレオニンキナーゼを含む少なくとも1つのプロテインキナーゼの小分子阻害剤である。マルチキナーゼ阻害剤は、単一キナーゼ阻害剤を含み得る。マルチキナーゼ阻害剤はリン酸化をブロックし得る。マルチキナーゼ阻害剤は、プロテインキナーゼの共有結合修飾因子として作用し得る。マルチキナーゼ阻害剤は、キナーゼ活性部位、またはプロテインキナーゼ活性を阻害する二次または三次部位に結合し得る。マルチキナーゼ阻害剤は、抗癌マルチキナーゼ阻害剤であり得る。抗癌マルチキナーゼ阻害剤の例には、ダサチニブ、スニチニブ、エルロチニブ、ベバシズマブ、バタラニブ、ベムラフェニブ、バンデタニブ、カボザンチニブ、ポアチニブ、アキシチニブ、ルキソリチニブ、レゴラフェニブ、クリゾチニブ、ボスチニブ、セツキシマブ、ゲフィチニブ、イマチニブ、ラパチニブ、レンバチニブ、ムブリチニブ、ニロチニブ、パニツムマブ、パゾパニブ、トラスツズマブ、またはソラフェニブが含まれる。 A "multikinase inhibitor" is a small molecule inhibitor of at least one protein kinase, including tyrosine protein kinases and serine/threonine kinases. A multi-kinase inhibitor can include a single kinase inhibitor. Multikinase inhibitors can block phosphorylation. Multikinase inhibitors can act as covalent modifiers of protein kinases. Multikinase inhibitors can bind to the kinase active site, or secondary or tertiary sites that inhibit protein kinase activity. The multikinase inhibitor can be an anti-cancer multikinase inhibitor. Examples of anticancer multikinase inhibitors include dasatinib, sunitinib, erlotinib, bevacizumab, vatalanib, vemurafenib, vandetanib, cabozantinib, poatinib, axitinib, ruxolitinib, regorafenib, crizotinib, bosutinib, cetuximab, gefitinib, imatinib, lapatinib, ren vatinib, mbritinib , nilotinib, panitumumab, pazopanib, trastuzumab, or sorafenib.

本明細書でしようされる場合、「約」という用語は、指定された値を含む値の範囲であって、当業者であれば、指定された値と合理的に同様であると考える範囲を意味する。実施形態において、「約」とは、当技術分野で一般的に許容される測定値を用いた標準偏差以内のことを意味する。実施形態において、「約」は、指定された値の+/-10%までの範囲を意味する。実施形態において、「約」は指定された値を含む。 As used herein, the term "about" includes a range of values inclusive of the specified value that a person of ordinary skill in the art would consider to be reasonably similar to the specified value. means. In embodiments, "about" means within a standard deviation using measurements generally accepted in the art. In embodiments, "about" means a range of up to +/−10% of the specified value. In embodiments, "about" includes the specified value.

開示された主題の態様は、対象からのサンプル中の1つ以上のRNA分子の分析に基づいて、対象における、疾患状態(例えば、癌の存在または非存在)および/または疾患の起源組織を検出する方法を含む。いくつかの実施形態において、対象における疾患状態を検出する方法は、対象から複数の無細胞リボ核酸(cfRNA)分子を含む生物学的試験サンプルを単離すること、該生物学的試験サンプルからcfRNA分子を抽出すること、抽出されたcfRNA分子に対してシーケンシング手順を実行して、複数の配列リードを生成すること、フィルタリング手順を実行して、1つ以上の健常細胞に由来する配列リードの除外集団と、配列リードの非除外集団とを生成すること、および/または非除外配列リードに対して定量化手順を実行すること、を含む。実施形態において、前記方法は、定量化手順が閾値を超える値を生成した場合に、対象における疾患状態を検出することを含む。実施形態において、閾値を超える1つ以上の非除外配列リードを検出することは、(i)検出、(ii)バックグラウンドを超える検出、および/または(iii)状態を有さない対象における対応する配列リードのレベルよりも高いレベルでの検出、を含む。さまざまな実施形態において、閾値は、約または正確に1~約または正確に10の範囲の整数であり、例えば約もしくは正確に2、3、4、5、6、7、8、または約もしくは正確に9である。いくつかの実施形態において、閾値は、約または正確に0.1~約または正確に0.9の範囲の非整数値であり、例えば約もしくは正確に0.2、0.3、0.4、0.5、0.6、0.7、または約もしくは正確に0.8である。 Aspects of the disclosed subject matter detect a disease state (e.g., the presence or absence of cancer) and/or the tissue of origin of the disease in a subject based on analysis of one or more RNA molecules in a sample from the subject. including how to In some embodiments, a method of detecting a disease state in a subject comprises isolating from the subject a biological test sample comprising a plurality of cell-free ribonucleic acid (cfRNA) molecules; extracting molecules; performing a sequencing procedure on the extracted cfRNA molecules to generate a plurality of sequence reads; performing a filtering procedure to extract sequence reads derived from one or more healthy cells; generating an excluded population and a non-excluded population of sequence reads and/or performing a quantification procedure on the non-excluded sequence reads. In embodiments, the method comprises detecting a disease state in the subject when the quantification procedure produces a value above the threshold. In embodiments, detecting one or more non-excluded sequence reads above a threshold is (i) detected, (ii) detected above background, and/or (iii) corresponding detection at a level higher than that of sequence reads. In various embodiments, the threshold is an integer ranging from about or exactly 1 to about or exactly 10, such as about or exactly 2, 3, 4, 5, 6, 7, 8, or about or exactly is 9 at . In some embodiments, the threshold is a non-integer value ranging from about or exactly 0.1 to about or exactly 0.9, such as about or exactly 0.2, 0.3, 0.4 , 0.5, 0.6, 0.7, or about or exactly 0.8.

いくつかの実施形態において、前記方法は、生物学的試験サンプルから抽出されたcfRNA分子を検出および定量化するためのシーケンシング手順の使用を含む。例えば、さまざまな実施形態において、シーケンシング手順は、cfRNA分子に逆転写手順を実行して複数のcDNA/RNAハイブリッド分子を生成することと、該ハイブリッド分子のRNAを分解して複数の一本鎖cDNA分子テンプレートを生成することと、該一本鎖cDNA分子テンプレートから複数の二本鎖DNA分子を合成することと、複数の二本鎖DNAアダプターを該複数の二本鎖DNA分子にライゲーションしてシーケンシングライブラリを生成することと、該シーケンシングライブラリの少なくとも一部に対してシーケンシング手順を実行して複数の配列リードを得ることを含む。さまざまな実施形態において、二本鎖DNA分子を合成することは、鎖置換逆転写酵素手順(strand-displacement reverse transcriptase procedure)を実行することを含む。 In some embodiments, the methods comprise the use of sequencing procedures to detect and quantify cfRNA molecules extracted from biological test samples. For example, in various embodiments, a sequencing procedure includes subjecting a cfRNA molecule to a reverse transcription procedure to produce a plurality of cDNA/RNA hybrid molecules, and degrading the RNA of the hybrid molecules to produce a plurality of single-stranded molecules. generating a cDNA molecular template; synthesizing a plurality of double-stranded DNA molecules from the single-stranded cDNA molecular template; ligating a plurality of double-stranded DNA adapters to the plurality of double-stranded DNA molecules; generating a sequencing library; and performing a sequencing procedure on at least a portion of the sequencing library to obtain a plurality of sequence reads. In various embodiments, synthesizing the double-stranded DNA molecule comprises performing a strand-displacement reverse transcriptase procedure.

いくつかの実施形態において、前記方法は、全トランスクリプトームシーケンシング手順を利用する。他の実施形態において、シーケンシング手順は標的化シーケンシング手順を含み、シーケンシングライブラリを調製する前に、cfRNA分子の1つ以上が生物学的試験サンプルから濃縮される。この実施形態によれば、疾患状態を示す1つ以上のcfRNA分子が濃縮の標的となる。例えば、いくつかの実施形態において、1つ以上の標的化cfRNA分子は、AGR2、BPIFA1、CASP14、CSN1S1、DISP2、EIF2D、FABP7、GABRG1、GNAT3、GRHL2、HOXC10、IDI2-AS1、KRT16P2、LALBA、LINC00163、NKX2-1、OPN1SW、PADI3、PTPRZ1、ROS1、S100A7、SCGB2A2、SERPINB5、SFTA3、SFTPA2、SLC34A2、TFF1、VTCN1、WFDC2、MUC5B、SMIM22、CXCL17、RNU1-1およびKLK5からなる群から選択される1つ以上の遺伝子に由来し、それらの任意の組み合わせを含み得る。いくつかの実施形態において、1つ以上の標的RNA分子は、ROS1、NKX2-1、GGTLC1、SLC34A2、SFTPA2、BPIFA1、SFTA3、GABRG1、AGR2、GNAT3、MUC5B、SMIM22、CXCL17およびWFDC2からなる群から選択される1つ以上の遺伝子に由来し、それらの任意の組み合わせを含み得る。いくつかの実施形態において、1つ以上の標的RNA分子は、SCGB2A2、CSN1S1、VTCN、FABP7、LALBA、RNU1-1、OPN1SW、CASP14、KLK5およびWFDC2からなる群から選択される1つ以上の遺伝子に由来し、それらの任意の組み合わせを含み得る。いくつかの実施形態において、1つ以上の標的RNA分子は、CASP14、CRABP2、FABP7、SCGB2A2、SERPINB5、TRGV10、VGLL1、TFF1およびAC007563.5からなる群から選択される1つ以上の遺伝子に由来し、それらの任意の組み合わせを含み得る。さらに他の実施形態において、標的化RNA分子は、AKR1B10、C3、および/またはPIEXO2遺伝子に由来する。 In some embodiments, the method utilizes whole transcriptome sequencing procedures. In other embodiments, the sequencing procedure comprises a targeted sequencing procedure, wherein one or more of the cfRNA molecules are enriched from the biological test sample prior to preparing the sequencing library. According to this embodiment, one or more cfRNA molecules indicative of a disease state are targeted for enrichment. For example, in some embodiments, the one or more targeting cfRNA molecules is AGR2, BPIFA1, CASP14, CSN1S1, DISP2, EIF2D, FABP7, GABRG1, GNAT3, GRHL2, HOXC10, IDI2-AS1, KRT16P2, LALBA, LINC00163 , NKX2-1, OPN1SW, PADI3, PTPRZ1, ROS1, S100A7, SCGB2A2, SERPINB5, SFTA3, SFTPA2, SLC34A2, TFF1, VTCN1, WFDC2, MUC5B, SMIM22, CXCL17, RNU1-1 and KLK5 It can be derived from more than one gene and can include any combination thereof. In some embodiments, the one or more target RNA molecules are selected from the group consisting of ROS1, NKX2-1, GGTLC1, SLC34A2, SFTPA2, BPIFA1, SFTA3, GABRG1, AGR2, GNAT3, MUC5B, SMIM22, CXCL17 and WFDC2 derived from one or more genes, including any combination thereof. In some embodiments, the one or more target RNA molecules target one or more genes selected from the group consisting of SCGB2A2, CSN1S1, VTCN, FABP7, LALBA, RNU1-1, OPN1SW, CASP14, KLK5 and WFDC2. derived from, and may include any combination thereof. In some embodiments, the one or more target RNA molecules are derived from one or more genes selected from the group consisting of CASP14, CRABP2, FABP7, SCGB2A2, SERPINB5, TRGV10, VGLL1, TFF1 and AC007563.5. , may include any combination thereof. In yet other embodiments, targeting RNA molecules are derived from the AKR1B10, C3, and/or PIEXO2 genes.

開示される主題の態様は、健常対象の血漿中での発現が非常に低いか存在しない、1つ以上のダークチャネルRNA分子の分析を含む。健常対象の血漿中での発現レベルが低いため、ダークチャネルRNA分子は、本発明の方法と組み合わせて使用され得る高いシグナル対ノイズ比を提供する。 Aspects of the disclosed subject matter include analysis of one or more dark channel RNA molecules with very low or no expression in the plasma of healthy subjects. Due to their low expression levels in the plasma of healthy subjects, dark channel RNA molecules provide high signal-to-noise ratios that can be used in conjunction with the methods of the invention.

開示される主題のいくつかの態様は、1つ以上の健常細胞に由来する配列リードの除外集団と、その後の分析に使用される配列リードの非除外集団とを生成するために使用されるフィルタリング手順を含む。さまざまな実施形態において、フィルタリング手順は、生物学的試験サンプルから抽出されたcfRNA分子からの各配列リードをRNA配列の対照データセットと比較することと、該RNA配列の対照データセット中の1つ以上の配列リードとマッチする1つ以上の配列リードを同定することと、該RNA配列の対照データセット中の1つ以上の配列リードとマッチする各配列リードを配列リードの除外集団に配置することを含む。 Some aspects of the disclosed subject matter are filtering used to generate an excluded population of sequence reads derived from one or more healthy cells and a non-excluded population of sequence reads used for subsequent analysis. including instructions. In various embodiments, the filtering procedure comprises comparing each sequence read from a cfRNA molecule extracted from a biological test sample to a control dataset of RNA-sequences, and identifying one or more sequence reads that match the above sequence reads and placing each sequence read that matches one or more sequence reads in a control data set of said RNA sequences into an exclusion population of sequence reads. including.

いくつかの実施形態において、RNA配列の対照データセットは、1以上の健常対象から得られた複数の配列リードを含む。いくつかの実施形態において、RNA配列の対照データセットは、対象の複数の血液細胞から得られた複数の配列リードを含む。例えば、いくつかの実施形態では、複数の配列リードが対象の白血球(WBC)から得られる。 In some embodiments, the RNA-seq control data set comprises a plurality of sequence reads obtained from one or more healthy subjects. In some embodiments, the RNA-seq control data set comprises a plurality of sequence reads obtained from a plurality of blood cells of the subject. For example, in some embodiments, multiple sequence reads are obtained from a subject's white blood cells (WBC).

生物学的サンプル
さまざまな実施形態において、本開示は、対象から試験サンプル、例えば組織サンプルおよび/または体液サンプルなどの生物学的試験サンプルを、その中の複数の核酸(例えば、複数のcfRNA分子)を分析する目的で得ることを含む。本発明の実施形態に従うサンプルは、臨床的に許容される任意の方法で採取することができる。複数の核酸を含むと疑われる任意のサンプルを本発明の方法とともに使用することができる。いくつかの実施形態において、サンプルは、組織、体液、またはそれらの組み合わせを含み得る。いくつかの実施形態において、生物学的サンプルは健常対象から採取される。いくつかの実施形態において、生物学的サンプルは、特定の疾患または障害(例えば、特定の癌または腫瘍)を有することが知られている対象から採取される。いくつかの実施形態において、生物学的サンプルは、特定の疾患または障害を有すると疑われる対象から採取される。
Biological Samples In various embodiments, the present disclosure provides a test sample, e.g., a biological test sample, such as a tissue sample and/or a bodily fluid sample, from a subject, a plurality of nucleic acids (e.g., a plurality of cfRNA molecules) therein. for the purposes of analysis. Samples according to embodiments of the present invention can be collected by any clinically acceptable method. Any sample suspected of containing multiple nucleic acids can be used with the methods of the invention. In some embodiments, a sample may comprise tissue, bodily fluid, or a combination thereof. In some embodiments, biological samples are obtained from healthy subjects. In some embodiments, a biological sample is taken from a subject known to have a particular disease or disorder (eg, a particular cancer or tumor). In some embodiments, a biological sample is taken from a subject suspected of having a particular disease or disorder.

本明細書で使用する場合、「組織」という用語は、連結した細胞および/または細胞外マトリックス物質の塊を指す。本発明の方法とともに一般的に使用される組織の非限定的な例としては、例えばヒトまたは非ヒト哺乳動物に由来する、皮膚、毛髪、指の爪、子宮内膜組織、鼻腔組織、中枢神経系(CNS)組織、神経組織、眼組織、肝組織、腎臓組織、胎盤組織、乳腺組織、胃腸組織、筋骨格系組織、泌尿生殖器組織、骨髄などが挙げられる。本発明の実施形態に従う組織サンプルは、例えば、限定されるものではないが、ホルマリン固定パラフィン包埋(FFPE)組織サンプル、新鮮な組織サンプル、および新鮮凍結(FF)組織サンプルなど、当技術分野で既知の任意の組織サンプルタイプの形態で調製および提供され得る。 As used herein, the term "tissue" refers to a mass of connected cells and/or extracellular matrix material. Non-limiting examples of tissues commonly used with the methods of the invention include skin, hair, fingernails, endometrial tissue, nasal tissue, central nervous system, e.g., from a human or non-human mammal. system (CNS) tissue, nervous tissue, eye tissue, liver tissue, kidney tissue, placental tissue, breast tissue, gastrointestinal tissue, musculoskeletal tissue, urogenital tissue, bone marrow, and the like. Tissue samples according to embodiments of the present invention include, but are not limited to, formalin-fixed paraffin-embedded (FFPE) tissue samples, fresh tissue samples, and fresh-frozen (FF) tissue samples. It can be prepared and provided in the form of any known tissue sample type.

本明細書で使用する場合、「体液」および「生体液」という用語は、対象、例えばヒトまたは非ヒト哺乳動物に由来する液体物質を指す。本発明の方法とともに一般的に使用される体液の非限定的な例としては、粘液、血液、血漿、血清、血清誘導体、滑液、リンパ液、胆汁、痰、唾液、汗、涙、喀痰、羊水、月経液、膣液、***、尿、腰部または脳室CSFなどの脳脊髄液(CSF)、胃液、鼻、喉または頬のぬぐい液に由来する1つ以上の物質を含む液体サンプル、腹膜洗浄、胃洗浄、胸腔洗浄または管洗浄などの洗浄手順に由来する1つ以上の物質を含む液体サンプルなどが挙げられる。 As used herein, the terms "bodily fluid" and "biological fluid" refer to liquid substances derived from a subject, eg, a human or non-human mammal. Non-limiting examples of bodily fluids commonly used with the methods of the present invention include mucus, blood, plasma, serum, serum derivatives, synovial fluid, lymph, bile, sputum, saliva, sweat, tears, sputum, amniotic fluid. , menstrual fluid, vaginal fluid, semen, urine, cerebrospinal fluid (CSF) such as lumbar or ventricular CSF, gastric fluid, fluid samples containing one or more substances derived from nasal, throat or cheek swabs, peritoneal lavage , liquid samples containing one or more substances from lavage procedures such as gastric lavage, chest lavage or ductal lavage.

いくつかの実施形態において、サンプルは、微細針吸引物または生検組織を含むことができる。いくつかの実施形態において、サンプルは、細胞または生物学的物質を含有する培地を含むことができる。いくつかの実施形態において、サンプルは、血栓、例えば血清を除去した後の全血から得られた血栓を含むことができる。いくつかの実施形態において、サンプルは糞便を含むことができる。一つの好ましい実施形態において、サンプルは採取された全血である。一態様において、血漿、赤血球、白血球、および血小板などの全血サンプルの一部のみが使用される。いくつかの実施形態において、サンプルは、前記方法に関連して、2つ以上の成分部分に分離される。例えば、いくつかの実施形態において、全血サンプルは、血漿、赤血球、白血球、および血小板成分に分離される。 In some embodiments, a sample can comprise a fine needle aspirate or biopsy tissue. In some embodiments, a sample can include media containing cells or biological material. In some embodiments, the sample can comprise a thrombus, such as a thrombus obtained from whole blood after serum has been removed. In some embodiments, the sample can include feces. In one preferred embodiment, the sample is drawn whole blood. In one aspect, only a portion of a whole blood sample is used, such as plasma, red blood cells, white blood cells, and platelets. In some embodiments, the sample is separated into two or more component parts in connection with the method. For example, in some embodiments, a whole blood sample is separated into plasma, red blood cell, white blood cell, and platelet components.

いくつかの実施形態において、サンプルは、そのサンプルが採取された対象からだけでなく、サンプル採取時に対象内に存在するウイルスDNA/RNAなど、1つ以上の他の生物からの複数の核酸を含む。 In some embodiments, the sample contains multiple nucleic acids not only from the subject from which the sample was taken, but also from one or more other organisms, such as viral DNA/RNA present in the subject at the time the sample was taken. .

核酸は、当技術分野で既知の任意の適切な方法に従ってサンプルから抽出することができ、抽出された核酸は本明細書に記載の方法とともに利用することができる。例えば、Maniatis, et al., Molecular Cloning:A Laboratory Manual、Cold Spring Harbor、ニューヨーク、280-281頁、1982年を参照されたい(その内容は、参照によりその全体が本明細書に組み込まれる)。一つの好ましい実施形態において、無細胞リボ核酸(例えばcfRNA)がサンプルから抽出される。 Nucleic acids can be extracted from a sample according to any suitable method known in the art, and the extracted nucleic acids can be utilized with the methods described herein. For example, Maniatis, et al. , Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, New York, pp. 280-281, 1982, the contents of which are incorporated herein by reference in their entirety. In one preferred embodiment, cell-free ribonucleic acid (eg, cfRNA) is extracted from the sample.

実施形態において、サンプルは「マッチ」サンプルまたは「ペア」サンプルである。一般に、「マッチサンプル」および「ペアサンプル」という用語は、同じ対象から、好ましくはほぼ同時に(例えば、単一の手順もしくは受診の一部として、または同じ日に)採取された、異なる種類の一対のサンプルを指す。実施形態において、異なる種類とは、組織サンプル(例えば、切除または生検サンプルのような癌組織)および生体液サンプル(例えば、血液または血液フラクション)である。また、この用語は、マッチサンプル由来のポリヌクレオチド(例えば、癌組織から抽出したポリヌクレオチドを、マッチ生体液サンプル由来の無細胞ポリヌクレオチドとペアにしたもの)、またはそのシーケンシングリードを指すために使用されることもある。実施形態において、癌バイオマーカーを同定する場合などに、複数のペアサンプルが分析される。複数のペアサンプルは、(例えば、癌の初期ステージからのペアサンプルと、癌の後期ステージからのペアサンプルのように)異なる時期に採取された同一個体からのもの、同じ時期または異なる時期に異なる個体から採取されたもの、またはこれらの組み合わせであり得る。実施形態において、マッチサンプルは異なる対象からのものである。実施形態において、複数のマッチサンプルは、同じ癌の種類、任意に同じ癌ステージを有する対象からのものである。 In embodiments, the samples are "matched" or "paired" samples. In general, the terms "matched sample" and "paired sample" refer to a pair of different types of samples taken from the same subject, preferably at about the same time (e.g., as part of a single procedure or visit, or on the same day). refers to a sample of In embodiments, the different types are tissue samples (eg, cancerous tissue such as resection or biopsy samples) and biological fluid samples (eg, blood or blood fractions). The term is also used to refer to polynucleotides from a matched sample (e.g., polynucleotides extracted from cancer tissue paired with cell-free polynucleotides from a matched biological fluid sample), or sequencing reads thereof. sometimes used. In embodiments, multiple paired samples are analyzed, such as when identifying cancer biomarkers. Multiple paired samples may be from the same individual taken at different times (e.g., paired samples from early stages of cancer and paired samples from later stages of cancer), different times at the same time, or different times. It can be taken from an individual, or a combination thereof. In embodiments, the matched samples are from different subjects. In embodiments, the plurality of matched samples are from subjects with the same cancer type, optionally the same cancer stage.

アッセイプロトコル例
図1は、一実施形態による、シーケンシング用の核酸サンプルを調製するための方法100のフローチャートである。方法100は、限定されるものではないが、以下のステップを含む。例えば、方法100の任意のステップは、品質管理のための定量化サブステップまたは当業者に既知の他の実験室アッセイ手順を含んでもよい。
Example Assay Protocol FIG. 1 is a flowchart of a method 100 for preparing nucleic acid samples for sequencing, according to one embodiment. Method 100 includes, but is not limited to, the following steps. For example, any step of method 100 may include a quantification substep for quality control or other laboratory assay procedures known to those skilled in the art.

ステップ110で、対象からリボ核酸(RNA)サンプルを抽出する。RNAサンプルは、全ヒトトランスクリプトーム、またはヒトトランスクリプトームの任意のサブセットを含み得る。サンプルは、疾患(例えば、癌)を有することが知られている、または疾患(例えば、癌)を有すると疑われる対象から抽出され得る。サンプルには、血液、血漿、血清、尿、糞便、唾液、他の種類の体液、またはそれらの任意の組み合わせが含まれ得る。いくつかの実施形態において、血液サンプルを採取する方法(注射器または指を刺すなど)は、外科手術が必要となる場合がある組織生検を採取する手順よりも侵襲性が低い可能性がある。抽出されたサンプルは無細胞DNAをさらに含み得る。対象が疾患(例えば癌)を有する場合、抽出されたサンプル中のcfRNAが診断のために検出可能なレベルで存在する可能性がある。 At step 110, a ribonucleic acid (RNA) sample is extracted from the subject. An RNA sample can contain the entire human transcriptome, or any subset of the human transcriptome. A sample can be drawn from a subject known to have a disease (eg, cancer) or suspected of having a disease (eg, cancer). Samples can include blood, plasma, serum, urine, feces, saliva, other types of bodily fluids, or any combination thereof. In some embodiments, the method of obtaining a blood sample (such as a syringe or finger prick) may be less invasive than a tissue biopsy procedure that may require surgery. The extracted sample may further contain cell-free DNA. If the subject has a disease (eg, cancer), cfRNA in the extracted sample may be present at detectable levels for diagnosis.

ステップ120で、RNA分子を含む核酸サンプルを任意にDNase酵素で処理する。DNaseは、核酸サンプルからDNA分子を除去し、RNA分子のDNAコンタミネーションを低減する。RNA分子がDNAに変換された後は、RNAから変換されたDNAと、核酸サンプル中に元々存在していたゲノムDNAを区別することが困難になる場合がある。DNaseを適用すると、cfRNAに由来する分子の標的化増幅が可能になる。DNaseプロセスは、DNaseバッファーを添加するステップ、遠心分離機を使用してDNaseを適用したサンプルを混合するステップ、およびインキュベーションするステップを含み得る。いくつかの実施形態において、ステップ120は、Qiagen社のQIAamp循環核酸ハンドブックに記載されているDNase処理プロトコールに基づく1つ以上のプロセスを含む。 At step 120, the nucleic acid sample containing RNA molecules is optionally treated with a DNase enzyme. DNase removes DNA molecules from nucleic acid samples and reduces DNA contamination of RNA molecules. After the RNA molecule has been converted to DNA, it may be difficult to distinguish between the DNA converted from RNA and the genomic DNA originally present in the nucleic acid sample. Application of DNase allows targeted amplification of molecules derived from cfRNA. The DNase process may include adding a DNase buffer, using a centrifuge to mix the DNase-applied sample, and incubating. In some embodiments, step 120 includes one or more processes based on the DNase treatment protocol described in Qiagen's QIAamp Circulating Nucleic Acid Handbook.

ステップ130で、逆転写酵素を使用して、核酸サンプル中のRNA分子を相補的DNA(cDNA)に変換する。逆転写酵素プロセスは、第一鎖合成ステップ(逆転写によるcDNA鎖の生成)、一本鎖cDNA分子を生成するためのRNA鎖の分解、およびポリメラーゼを使用した一本鎖cDNA分子からの二本鎖DNA分子の合成を含み得る。第一鎖の合成中、プライマーはRNA分子の3’末端にアニーリングする。第二鎖の合成中、別のプライマーがcDNA分子の3’末端にアニーリングする。 At step 130, reverse transcriptase is used to convert the RNA molecules in the nucleic acid sample into complementary DNA (cDNA). The reverse transcriptase process consists of a first-strand synthesis step (reverse transcription to produce a cDNA strand), degradation of the RNA strand to produce a single-stranded cDNA molecule, and double stranding from the single-stranded cDNA molecule using a polymerase. It may involve synthesis of stranded DNA molecules. During first strand synthesis, the primer anneals to the 3' end of the RNA molecule. During second strand synthesis, another primer anneals to the 3' end of the cDNA molecule.

ステップ140で、シーケンシングライブラリを調製する。例えば、当技術分野でよく知られているように、アダプターをdsDNA分子の一方または両方の末端にライゲーションして、シーケンシング用のライブラリを調製することができる。一実施形態において、利用されるアダプターは、その後のクラスター生成および/またはシーケンシングで使用するための1つ以上のシーケンシングオリゴヌクレオチド(例えば、合成によるシーケンシング(SBS)(Illumina社、サンディエゴ、カリフォルニア州)で使用される既知のP5およびP7配列)を含み得る。別の実施形態において、アダプターはサンプル特異的なインデックス配列を含むため、ライブラリ調製後にライブラリを個々のサンプルから調製した1つ以上の他のライブラリと組み合わせることができ、それによってマルチプレックスシーケンシングが可能になる。サンプル特異的インデックス配列は、約もしくは正確に2nt~約もしくは正確に20nt、約もしくは正確に2nt~約もしくは正確に10nt、約もしくは正確に2nt~約もしくは正確に8nt、または約もしくは正確に2nt~約もしくは正確に6ntの長さを有する短いオリゴヌクレオチド配列を含むことができる。別の実施形態において、サンプル特異的インデックス配列は、長さが約または正確に2、3、4、5、6、7、または8ヌクレオチド(nt)超の短いオリゴヌクレオチド配列を含むことができる。 At step 140, a sequencing library is prepared. For example, adapters can be ligated to one or both ends of dsDNA molecules to prepare a library for sequencing, as is well known in the art. In one embodiment, the adapter utilized is one or more sequencing oligonucleotides (e.g., sequencing-by-synthesis (SBS) (Illumina, San Diego, Calif.) for use in subsequent cluster generation and/or sequencing. state) known P5 and P7 sequences). In another embodiment, the adapters contain sample-specific indexing sequences so that after library preparation the library can be combined with one or more other libraries prepared from individual samples, thereby enabling multiplexed sequencing. become. The sample-specific index sequence is from about or exactly 2 nt to about or exactly 20 nt, from about or exactly 2 nt to about or exactly 10 nt, from about or exactly 2 nt to about or exactly 8 nt, or from about or exactly 2 nt to Short oligonucleotide sequences having a length of about or exactly 6 nt can be included. In another embodiment, the sample-specific index sequences can comprise short oligonucleotide sequences about or exactly greater than 2, 3, 4, 5, 6, 7, or 8 nucleotides (nt) in length.

任意に、ライブラリ調製中、アダプターライゲーションを通じて、ユニーク分子識別子(UMI)をサンプル中の核酸分子に付加できる。UMIは、アダプターライゲーション中に核酸断片の一方または両方の末端に付加される短い核酸配列(例えば、4~10塩基対)である。いくつかの実施形態において、UMIは、特定の核酸断片に由来する配列リードを同定するために使用できる固有のタグとして機能する縮重塩基対である。アダプターライゲーション後のPCR増幅中に、UMIは結合した核酸断片とともに複製され、下流の分析で同じ元の核酸分子に由来する配列リードを同定する方法を提供する。 Optionally, a unique molecular identifier (UMI) can be added to the nucleic acid molecules in the sample through adapter ligation during library preparation. UMIs are short nucleic acid sequences (eg, 4-10 base pairs) added to one or both ends of nucleic acid fragments during adapter ligation. In some embodiments, UMIs are degenerate base pairs that function as unique tags that can be used to identify sequence reads derived from a particular nucleic acid fragment. During PCR amplification after adapter ligation, the UMI is replicated with the bound nucleic acid fragment, providing a method for downstream analysis to identify sequence reads derived from the same original nucleic acid molecule.

RNAの標的化シーケンシングを含む実施形態において、ステップ150で、標的化核酸配列がライブラリから濃縮される。濃縮中、ハイブリダイゼーションプローブ(本明細書では「プローブ」とも呼ばれる)を使用して、疾患(例えば、癌)の存在もしくは非存在、疾患の状態(例えば、癌の状態)、または疾患の分類(例えば、癌の種類または起源組織)についての情報となる核酸断片を標的にし、プルダウンする。所与のワークフローについて、プローブは、標的(相補的)核酸鎖(例えば、RNAから変換されたDNA鎖)にアニーリング(またはハイブリダイズ)するように設計され得る。プローブの長さは、10、100、または1000塩基対の範囲に及ぶ場合がある。一実施形態において、プローブは、特定の癌または他の種類の疾患に対応すると疑われるゲノム(例えば、ヒトまたは別の生物のゲノム)の特定の標的領域を分析するための遺伝子パネルに基づいて設計される。さらに、プローブは標的領域の重複部分をカバーする場合がある。他の実施形態において、逆転写酵素を使用してRNA分子をcDNA鎖に変換する前に、ハイブリダイゼーションプローブを使用して標的化RNA分子を濃縮することができる(図示せず)。一般に、当技術分野で知られている任意の方法を使用して、プローブとハイブリダイズした標的核酸を単離し、濃縮することができる。例えば、当技術分野でよく知られているように、ストレプトアビジンでコーティングされた表面(例えば、ストレプトアビジンでコーティングされたビーズ)を使用してプローブにハイブリダイズした標的核酸の単離を容易にするために、ビオチン部分をプローブの5’末端に付加(すなわち、ビオチン化)することができる。 In embodiments involving targeted sequencing of RNA, at step 150, targeted nucleic acid sequences are enriched from the library. During enrichment, hybridization probes (also referred to herein as "probes") are used to determine the presence or absence of a disease (e.g., cancer), disease state (e.g., cancer state), or disease classification ( Targeting and pulling down nucleic acid fragments that are informative about (eg, cancer type or tissue of origin). For a given workflow, probes can be designed to anneal (or hybridize) to a target (complementary) nucleic acid strand (eg, a DNA strand converted from RNA). Probe lengths can range from 10, 100, or 1000 base pairs. In one embodiment, probes are designed based on gene panels to analyze specific target regions of the genome (e.g., the genome of a human or another organism) suspected of corresponding to a particular cancer or other type of disease. be done. Additionally, the probes may cover overlapping portions of the target region. In other embodiments, hybridization probes can be used to enrich for targeted RNA molecules before reverse transcriptase is used to convert the RNA molecules into cDNA strands (not shown). In general, any method known in the art can be used to isolate and enrich the target nucleic acids hybridized with the probes. For example, streptavidin-coated surfaces (e.g., streptavidin-coated beads) are used to facilitate isolation of target nucleic acids hybridized to probes, as is well known in the art. For this purpose, a biotin moiety can be added (ie, biotinylated) to the 5' end of the probe.

さらに、標的化シーケンシングの場合、ステップ160で、濃縮された核酸サンプルから配列リードを生成する。シーケンシングデータは、当技術分野で既知の手段によって、濃縮されたDNA配列(すなわち、RNA配列に由来する、またはRNA配列から変換されたDNA配列)から取得され得る。例えば、方法100は、合成技術(Illumina社)、パイロシーケンシング(454 Life Sciences)、イオン半導体技術(Ion Torrentシーケンシング)、単一分子リアルタイムシーケンシング(Pacific Biosciences社)、ライゲーションによるシーケンシング(SOLiDシーケンシング)、ナノポアシーケンシング(Oxford Nanopore Technologies社)またはペアエンドシーケンシングを含む、次世代シーケンシング(NGS)技術を含み得る。いくつかの実施形態において、大規模並列シーケンシングは、可逆的なダイターミネータを使用した合成によるシーケンシングを使用して実行される。 Additionally, for targeted sequencing, step 160 generates sequence reads from the enriched nucleic acid sample. Sequencing data can be obtained from enriched DNA sequences (ie, DNA sequences derived from or converted from RNA sequences) by means known in the art. For example, the method 100 includes synthetic techniques (Illumina), pyrosequencing (454 Life Sciences), ionic semiconductor techniques (Ion Torrent sequencing), single molecule real-time sequencing (Pacific Biosciences), sequencing by ligation (SOLiD sequencing), nanopore sequencing (Oxford Nanopore Technologies) or paired-end sequencing (NGS) techniques. In some embodiments, massively parallel sequencing is performed using sequencing-by-synthesis using reversible dye terminators.

他の実施形態では、例えば、全トランスクリプトームシーケンシングアプローチ(例えば、標的化シーケンシングの代わりに)において、ステップ170で豊富なRNA種が核酸サンプルから枯渇される。例えば、いくつかの実施形態において、リボソームRNA(rRNA)および/またはトランスファーRNA(tRNA)種が枯渇され得る。RiboMinus(商標)(ThermoFisher Scientific社)またはAnyDeplete(NuGen社)などの市販のキットを、豊富なRNA種の枯渇に使用できる。一実施形態において、豊富なRNA分子に由来する核酸(例えば、変換されたDNA)を枯渇させた後、ステップ180で配列リードが生成される。 In other embodiments, abundant RNA species are depleted from the nucleic acid sample in step 170, for example, in whole transcriptome sequencing approaches (eg, instead of targeted sequencing). For example, in some embodiments, ribosomal RNA (rRNA) and/or transfer RNA (tRNA) species can be depleted. Commercially available kits such as RiboMinus™ (ThermoFisher Scientific) or AnyDeplete (NuGen) can be used for depletion of abundant RNA species. In one embodiment, sequence reads are generated at step 180 after depletion of nucleic acids (eg, converted DNA) from abundant RNA molecules.

いくつかの実施形態において、配列リードは、当技術分野で既知の方法を使用して参照ゲノムにアラインメントさせて、アラインメント位置情報を決定することができる。アラインメント位置情報は、所定の配列リードの開始ヌクレオチド塩基および終了ヌクレオチド塩基に対応する参照ゲノム内の領域の開始位置および終了位置を示し得る。アライメント位置情報は、開始位置と終了位置から決定できる配列リード長も含み得る。参照ゲノム内の領域は、遺伝子または遺伝子のセグメントに関連付けられている可能性がある。参照ゲノムは、全トランスクリプトーム、またはその任意の部分(例えば、複数の標的化転写産物)を含み得る。別の実施形態において、参照ゲノムは試験対象の生物由来の全ゲノムであり得、抽出されたRNA分子に由来する(または抽出されたRNA分子から逆転写された)配列リードが参照ゲノムにアラインメントされて、位置、断片長、および/または開始位置と終了位置が決定される。例えば、一実施形態において、配列リードはヒト参照ゲノムhg19にアライメントされる。ヒト参照ゲノムhg19の配列は、Genome Reference Consortiumから参照番号GRCh37/hg19で入手でき、またSanta Cruz Genomics Instituteが提供するGenome Browserからも入手できる。アラインメント位置情報は、所定の配列リードの開始ヌクレオチド塩基および終了ヌクレオチド塩基に対応する参照ゲノム内の領域の開始位置および終了位置を示し得る。アライメント位置情報は、開始位置と終了位置から決定できる配列リード長も含み得る。参照ゲノム内の領域は、遺伝子または遺伝子のセグメントに関連付けられている可能性がある。 In some embodiments, sequence reads can be aligned to a reference genome using methods known in the art to determine alignment position information. Alignment position information can indicate the start and end positions of regions within the reference genome that correspond to the starting and ending nucleotide bases of a given sequence read. Alignment position information can also include sequence read lengths that can be determined from start and end positions. Regions within the reference genome may be associated with genes or segments of genes. A reference genome can include an entire transcriptome, or any portion thereof (eg, multiple targeted transcripts). In another embodiment, the reference genome can be the entire genome from the organism under test, and the sequence reads derived from (or reverse transcribed from) the extracted RNA molecules are aligned to the reference genome. position, fragment length, and/or start and end positions are determined. For example, in one embodiment the sequence reads are aligned to the human reference genome hg19. The sequence of the human reference genome hg19 is available from the Genome Reference Consortium under reference number GRCh37/hg19 and is also available from the Genome Browser provided by the Santa Cruz Genomics Institute. Alignment position information can indicate the start and end positions of regions within the reference genome that correspond to the starting and ending nucleotide bases of a given sequence read. Alignment position information can also include sequence read lengths that can be determined from start and end positions. Regions within the reference genome may be associated with genes or segments of genes.

ダークチャネルRNA分子の同定
本開示の態様は、対象における疾患状態を示す1つ以上のRNA配列(または「ダークチャネルRNA分子」)を同定するためのコンピュータ実装方法を含む。いくつかの実施形態において、前記方法は、コンピュータシステムによって、疾患を有することが知られている対象から得られた第1の試験サンプルから複数のRNA分子からの配列リードの第1セットを取得し(第1の試験サンプルは複数の無細胞RNA(cfRNA)分子を含む)、対照サンプルから複数のRNA分子からの配列リードの第2セットを取得することと、配列リードの第1セットに存在し、配列リードの第2セットには存在しない1つ以上のRNA配列を検出して、疾患状態を示す1つ以上のRNA配列を同定することを含む。いくつかの実施形態において、患者から得られる第1の試験サンプルは、体液(例えば、血液、血漿、血清、尿、唾液、胸水、心膜液、脳脊髄液(CSF)、腹膜液、またはそれらの任意の組み合わせ)を含む。好ましい一実施形態において、患者から得られる試験サンプルは血漿サンプルである。いくつかの実施形態において、対照サンプルは、対象からの健常細胞(例えば、白血球)から得られた複数のRNA分子を含む。
Identification of Dark Channel RNA Molecules Aspects of the present disclosure include computer-implemented methods for identifying one or more RNA sequences (or "dark channel RNA molecules") indicative of a disease state in a subject. In some embodiments, the method obtains, by a computer system, a first set of sequence reads from a plurality of RNA molecules from a first test sample obtained from a subject known to have the disease. (the first test sample comprises a plurality of cell-free RNA (cfRNA) molecules), obtaining a second set of sequence reads from the plurality of RNA molecules from the control sample; , detecting one or more RNA sequences not present in the second set of sequence reads to identify one or more RNA sequences indicative of the disease state. In some embodiments, the first test sample obtained from the patient is a bodily fluid (e.g., blood, plasma, serum, urine, saliva, pleural effusion, pericardial fluid, cerebrospinal fluid (CSF), peritoneal fluid, or any combination of In one preferred embodiment, the test sample obtained from the patient is a plasma sample. In some embodiments, a control sample comprises a plurality of RNA molecules obtained from healthy cells (eg, white blood cells) from the subject.

図2は、本開示の一実施形態による、疾患状態を示す1つ以上のRNA配列を同定する方法を示すフローダイアグラムである。図2に示すように、ステップ210で、複数の無細胞RNA(cfRNA)分子を含む生物学的試験サンプルから配列リードの第1セットを取得する。無細胞含有生物学的試験サンプルは、血液、血漿、血清、尿、胸水、脳脊髄液、涙、唾液、または腹水などの任意の体液であり得る。この実施形態に従って、cfRNA生物学的試験サンプルは、疾患を有することが知られている、または疾患を有すると疑われる対象から得られ、サンプルからcfRNA分子が抽出され、配列リードが決定される(本明細書の他の箇所に記載されるように)。例えば、一実施形態において、逆転写ステップを使用して相補的なDNA鎖が合成され、cDNA/RNAハイブリッド分子が生成され、RNA分子が分解され、ポリメラーゼを使用してcDNA鎖から二本鎖DNA分子が合成され、シーケンシングライブラリが調製され、シーケンシングプラットホームを使用して配列リードが決定される。シーケンシングステップは、前述のように、当技術分野で知られている任意のシーケンシングプラットホーム、例えば、合成によるシーケンシングプラットホーム(例えば、Illumina社のHiSeq X)またはライゲーションによるシーケンシングプラットホーム(例えば、Life Technologies社のSOLiDプラットホーム)を含む任意の大規模並列シーケンシングプラットホーム、Ion Torrent/Ion Proton、半導体シーケンシング、Roche 454、単一分子シーケンシングプラットホーム(例えば、Helicos、Pacific Biosciencesおよびnanopore)を使用して実施することができる。あるいは、配列リードを検出および定量化するための他の手段が使用され得、例えば、アレイベースのハイブリダイゼーション、プローブベースの溶液中ハイブリダイゼーション、ライゲーションベースのアッセイ、プライマー伸長反応アッセイが、当業者であれば容易に理解されるように、(例えば、RNA分子から変換された)DNA分子から配列リードを決定するために使用され得る。 Figure 2 is a flow diagram showing a method of identifying one or more RNA sequences indicative of a disease state, according to one embodiment of the present disclosure. As shown in Figure 2, at step 210, a first set of sequence reads is obtained from a biological test sample containing a plurality of cell-free RNA (cfRNA) molecules. A cell-free biological test sample can be any bodily fluid such as blood, plasma, serum, urine, pleural effusion, cerebrospinal fluid, tears, saliva, or ascites. According to this embodiment, a cfRNA biological test sample is obtained from a subject known to have or suspected of having a disease, cfRNA molecules are extracted from the sample, and sequence reads are determined ( as described elsewhere herein). For example, in one embodiment, a reverse transcription step is used to synthesize a complementary DNA strand to produce a cDNA/RNA hybrid molecule, the RNA molecule is degraded, and a polymerase is used to convert the cDNA strand to double-stranded DNA. Molecules are synthesized, sequencing libraries are prepared, and sequence reads are determined using a sequencing platform. The sequencing step, as described above, can be performed on any sequencing platform known in the art, such as a sequencing-by-synthesis platform (e.g., Illumina's HiSeq X) or a sequencing-by-ligation platform (e.g., Life Technologies, Inc.'s SOLiD platform), Ion Torrent/Ion Proton, Semiconductor Sequencing, Roche 454, Single Molecule Sequencing Platforms (e.g. Helicos, Pacific Biosciences and nanopore) can be implemented. Alternatively, other means for detecting and quantifying sequence reads can be used, e.g., array-based hybridization, probe-based in-solution hybridization, ligation-based assays, primer extension reaction assays, are known to those skilled in the art. As will be readily appreciated, it can be used to determine sequence reads from DNA molecules (eg, converted from RNA molecules).

ステップ220で、健常対照サンプルから配列リードの第2セットを取得する。一実施形態において、健常対照サンプルは同じ対象からのものであり、複数の細胞RNA分子を含む。例えば、対照サンプルは白血球などの血液細胞であり得、複数の配列リードは血液細胞から抽出されたRNA分子に由来する。この実施形態に従って、RNA分子は健常対照サンプル(例えば、血液細胞)から抽出され、DNAに変換され、シーケンシングライブラリが調製され、配列リードの第2セットが決定される(本明細書の他の箇所に記載されるように)。他の実施形態において、健常対照サンプルは、健常対象または健常細胞から得られたRNA配列について決定された配列データのデータベースであり得る。 At step 220, a second set of sequence reads is obtained from healthy control samples. In one embodiment, the healthy control sample is from the same subject and contains multiple cellular RNA molecules. For example, the control sample can be blood cells, such as white blood cells, and the multiple sequence reads are derived from RNA molecules extracted from the blood cells. According to this embodiment, RNA molecules are extracted from a healthy control sample (e.g., blood cells), converted to DNA, a sequencing library is prepared, and a second set of sequence reads is determined (see other as noted elsewhere). In other embodiments, a healthy control sample can be a database of sequence data determined for RNA sequences obtained from healthy subjects or healthy cells.

ステップ230で、配列リードの第1セットの配列リードと、配列リードの第2セットの配列リードを比較して、疾患状態を示す1つ以上のRNA分子を同定する。さらに、配列リードの第1セットに存在し、配列リードの第2セットには存在しない1つ以上の配列リード(RNA分子に由来する)を、疾患状態を示すRNA分子に由来するものとして同定する。例えば、配列リードの第1セットは、疾患(例えば、癌)を有することが知られている、または疾患(例えば、癌)を有すると疑われる対象から得られた血漿サンプルからのcfRNA分子に由来する配列リードを含むことができる。そして、配列リードの第2セットは、健常細胞(例えば、白血球)からのRNA分子に由来する配列リードを含むことができる。無細胞RNAサンプルに由来する配列リードの第1セットから、健常細胞に由来する配列リードの第2セットを比較し、除去することによって、疾患状態(例えば、癌)に由来する配列リードを同定することができる。 At step 230, the sequence reads of the first set of sequence reads are compared to the sequence reads of the second set of sequence reads to identify one or more RNA molecules indicative of the disease state. Further, one or more sequence reads (derived from RNA molecules) that are present in the first set of sequence reads and not present in the second set of sequence reads are identified as derived from RNA molecules indicative of the disease state. . For example, the first set of sequence reads are derived from cfRNA molecules from a plasma sample obtained from a subject known to have a disease (e.g., cancer) or suspected of having a disease (e.g., cancer) can contain sequence reads that The second set of sequence reads can then include sequence reads derived from RNA molecules from healthy cells (eg, leukocytes). Identifying sequence reads from a disease state (e.g., cancer) by comparing and removing a second set of sequence reads from healthy cells from the first set of sequence reads from a cell-free RNA sample be able to.

いくつかの実施形態において、RNA配列の対照データセットは、1以上の健常対象から得られた複数の配列リードを含む。さまざまな実施形態において、配列リードの第2セットは、公共データベースから取得したRNA配列情報を含む。本発明の実施形態に従って使用できる公共データベースには、組織RNA配列データベースGTEx(gtexportal.org/homeで利用可能)が含まれる。いくつかの実施形態において、RNA配列の対照データセットは、対象からの複数の血液細胞から得られた複数の配列リードを含む。例えば、いくつかの実施形態において、複数の配列リードが対象の白血球(WBC)から得られる。 In some embodiments, the RNA-seq control data set comprises a plurality of sequence reads obtained from one or more healthy subjects. In various embodiments, the second set of sequence reads comprises RNA sequence information obtained from public databases. Public databases that can be used in accordance with embodiments of the present invention include the tissue RNA sequence database GTEx (available at gtexportal.org/home). In some embodiments, the RNA-seq control data set comprises a plurality of sequence reads obtained from a plurality of blood cells from the subject. For example, in some embodiments, multiple sequence reads are obtained from a subject's white blood cells (WBCs).

腫瘍由来RNA分子の検出
本開示の態様は、対象における1つ以上の腫瘍由来RNA分子を検出するためのコンピュータ実装方法を含む。いくつかの実施形態において、前記方法は、コンピュータシステムによって、腫瘍を有することが知られている対象からの第1の試験サンプルから複数のRNA分子からの配列リードの第1セットを取得することであって、前記第1の試験サンプルは複数の無細胞RNA(cfRNA)分子を含む、取得すること;コンピュータシステムによって、対象からの複数の血液細胞から複数のRNA分子からの配列リードの第2セットを取得すること;および/またはコンピュータシステムによって、配列リードの第1セットに存在し、配列リードの第2セットには存在しない1つ以上のRNA配列を検出して、対象における1つ以上の腫瘍由来RNA分子を検出すること;を含む。
Detection of Tumor-Derived RNA Molecules Aspects of the present disclosure include computer-implemented methods for detecting one or more tumor-derived RNA molecules in a subject. In some embodiments, the method comprises obtaining, by a computer system, a first set of sequence reads from a plurality of RNA molecules from a first test sample from a subject known to have a tumor. obtaining, wherein said first test sample comprises a plurality of cell-free RNA (cfRNA) molecules; obtaining, by a computer system, a second set of sequence reads from a plurality of RNA molecules from a plurality of blood cells from the subject; and/or detecting, by a computer system, one or more RNA sequences present in the first set of sequence reads and not present in the second set of sequence reads to obtain one or more tumors in the subject detecting the originating RNA molecule;

いくつかの実施形態において、患者から得られた第1の試験サンプルは、血液、血漿、血清、尿、唾液、胸水、心膜液、脳脊髄液(CSF)、腹膜液、またはそれらの組み合わせを含む。好ましい一実施形態において、患者から得られた試験サンプルは血漿サンプルである。いくつかの実施形態において、対象から得られた複数の血液細胞は白血球(WBC)である。 In some embodiments, the first test sample obtained from the patient is blood, plasma, serum, urine, saliva, pleural effusion, pericardial fluid, cerebrospinal fluid (CSF), peritoneal fluid, or a combination thereof. include. In one preferred embodiment, the test sample obtained from the patient is a plasma sample. In some embodiments, the plurality of blood cells obtained from the subject are white blood cells (WBC).

図3は、本発明の一実施形態による、1つ以上の腫瘍由来RNA配列を同定する方法を示すフローダイアグラムである。ステップ310で、複数の無細胞RNA(cfRNA)分子を含む生物学的試験サンプルから配列リードの第1セットを取得する。この実施形態に従って、cfRNA生物学的試験サンプルは、疾患を有することが知られている、または疾患を有すると疑われる対象から得られ、サンプルからcfRNA分子が抽出され、配列リードが決定される(本明細書の他の箇所に記載されるように)。例えば、一実施形態において、逆転写ステップを使用して相補的なDNA鎖が合成され、cDNA/RNAハイブリッド分子が生成され、RNA分子が分解され、ポリメラーゼを使用してcDNA鎖から二本鎖DNA分子が合成され、シーケンシングライブラリが調製され、シーケンシングプラットホームを使用して配列リードが決定される。シーケンシングステップは、前述したように、当技術分野で知られている任意のシーケンシングプラットホームを使用して実行することができる。あるいは、当業者であれば容易に理解できるように、配列リードを決定するための他の手段、例えば、アレイベースのハイブリダイゼーション、プローブベースの溶液中ハイブリダイゼーション、ライゲーションベースのアッセイ、プライマー伸長反応アッセイを使用して、DNA分子から得られた(例えば、RNA分子から変換された)配列リードを検出および/または定量化することができる。 FIG. 3 is a flow diagram showing a method of identifying one or more tumor-derived RNA sequences, according to one embodiment of the invention. At step 310, a first set of sequence reads is obtained from a biological test sample containing a plurality of cell-free RNA (cfRNA) molecules. According to this embodiment, a cfRNA biological test sample is obtained from a subject known to have or suspected of having a disease, cfRNA molecules are extracted from the sample, and sequence reads are determined ( as described elsewhere herein). For example, in one embodiment, a reverse transcription step is used to synthesize a complementary DNA strand to produce a cDNA/RNA hybrid molecule, the RNA molecule is degraded, and a polymerase is used to convert the cDNA strand to double-stranded DNA. Molecules are synthesized, sequencing libraries are prepared, and sequence reads are determined using a sequencing platform. The sequencing step, as described above, can be performed using any sequencing platform known in the art. Alternatively, other means for determining sequence reads, such as array-based hybridization, probe-based in-solution hybridization, ligation-based assays, primer extension assays, as readily appreciated by those skilled in the art. can be used to detect and/or quantify sequence reads obtained from DNA molecules (eg, converted from RNA molecules).

ステップ315で、血液細胞(例えば、白血球またはバフィーコート)から配列リードの第2セットを取得する。一実施形態において、血液細胞は同じ対象から採取され、そこからRNA分子が抽出される。この実施形態に従って、RNA分子は血液細胞から抽出され、DNAに変換され、シーケンシングライブラリが調製され、配列リードの第2セットが決定される(本明細書の他の箇所に記載されるように)。一般に、当技術分野で知られている任意の方法を使用して、試験サンプルから無細胞核酸を抽出および精製することができる。例えば、無細胞核酸は、QIAamp循環核酸キット(Qiagen)などの1つ以上の既知の市販のプロトコールまたはキットを使用して抽出および精製することができる。 At step 315, a second set of sequence reads is obtained from blood cells (eg, white blood cells or buffy coat). In one embodiment, blood cells are obtained from the same subject and RNA molecules are extracted therefrom. According to this embodiment, RNA molecules are extracted from blood cells, converted to DNA, a sequencing library is prepared, and a second set of sequence reads is determined (as described elsewhere herein). ). Generally, any method known in the art can be used to extract and purify cell-free nucleic acids from a test sample. For example, cell-free nucleic acids can be extracted and purified using one or more known, commercially available protocols or kits, such as the QIAamp Circulating Nucleic Acid Kit (Qiagen).

ステップ320で、1つ以上のRNA配列が配列リードの第1セットに存在し、配列リードの第2セットには存在しない場合に、1つ以上の腫瘍由来RNA分子を検出する。さらに、配列リードの第1セットに存在し、配列リードの第2セットには存在しない1つ以上の配列リード(RNA分子に由来する)が、疾患状態を示すRNA分子に由来するものとして同定される。例えば、配列リードの第1セットは、疾患(例えば、癌)を有することが知られている、または疾患(例えば、癌)を有すると疑われる対象から得られた血漿サンプルからのcfRNA分子に由来する配列リードを含むことができる。そして、配列リードの第2セットは、血液細胞(例えば、白血球)からのRNA分子に由来する配列リードを含むことができる。無細胞RNAサンプルに由来する配列リードの第1セットから血液細胞に由来する配列リードの第2セットを比較して除去することにより、腫瘍に由来する配列リードを同定することができる。 At step 320, one or more tumor-derived RNA molecules are detected if the one or more RNA sequences are present in the first set of sequence reads and absent in the second set of sequence reads. Additionally, one or more sequence reads (derived from an RNA molecule) present in the first set of sequence reads and absent in the second set of sequence reads are identified as derived from an RNA molecule indicative of a disease state. be. For example, the first set of sequence reads are derived from cfRNA molecules from a plasma sample obtained from a subject known to have a disease (e.g., cancer) or suspected of having a disease (e.g., cancer) can contain sequence reads that A second set of sequence reads can then include sequence reads derived from RNA molecules from blood cells (eg, white blood cells). By comparing and removing a second set of sequence reads derived from blood cells from the first set of sequence reads derived from the cell-free RNA sample, sequence reads derived from the tumor can be identified.

ダークチャネルRNA分子を用いた疾患状態の検出
図4は、本発明の一実施形態による、対象における癌の存在を検出する、癌の状態を決定する、癌の進行を監視する、および/または癌の種類を決定するための方法を示すフローダイアグラムである。ステップ410で、対象から生物学的試験サンプルを単離する。前述したように、一実施形態において、試験サンプルは、複数の無細胞RNA分子を含む体液(例えば、血液、血漿、血清、尿、唾液、胸水、心膜液、脳脊髄液(CSF)、腹膜液、またはそれらの任意の組み合わせ)であり得る。
Detection of Disease States Using Dark Channel RNA Molecules FIG. 1 is a flow diagram showing a method for determining the type of At step 410, a biological test sample is isolated from the subject. As noted above, in one embodiment, the test sample is a body fluid comprising a plurality of cell-free RNA molecules (e.g., blood, plasma, serum, urine, saliva, pleural effusion, pericardial fluid, cerebrospinal fluid (CSF), peritoneal liquid, or any combination thereof).

ステップ415で、試験サンプルおよび調製したシーケンシングライブラリから複数の無細胞RNA分子を抽出する。一般に、当技術分野で知られている任意の方法を使用して、試験サンプルから無細胞核酸を抽出および精製することができる。例えば、無細胞核酸(cfRNA分子)は、QIAamp循環核酸キット(Qiagen)などの1つ以上の既知の市販プロトコールまたはキットを使用して抽出および精製できる。抽出後、cfRNA分子を使用してシーケンシングライブラリを調製する。一実施形態において、逆転写ステップを使用して複数のcDNA/RNAハイブリッド分子を作製し、RNA鎖を分解して一本鎖cDNA分子を作製し、第二鎖を合成して一本鎖cDNA分子テンプレートから複数の二本鎖DNA分子を作製し、DNAアダプターを複数の二本鎖DNA分子にライゲーションしてシーケンシングライブラリを生成する。前述したように、DNAアダプターには、その後のクラスター生成および/またはシーケンシングで使用するための1つ以上のシーケンシングオリゴヌクレオチド(例えば、合成によるシーケンシング(SBS)に使用される既知のP5およびP7配列(Illumina社、サンディエゴ、カリフォルニア州))が含まれる場合がある。別の実施形態において、アダプターにはサンプル固有のインデックス配列が含まれているため、ライブラリ調製後にライブラリを個々のサンプルから調製した1つ以上の他のライブラリと組み合わせることができ、それによってマルチプレックスシーケンシングが可能になる。別の実施形態において、ユニーク分子識別子(UMI)がアダプターライゲーションによって付加される。 At step 415, a plurality of cell-free RNA molecules are extracted from the test sample and the prepared sequencing library. Generally, any method known in the art can be used to extract and purify cell-free nucleic acids from a test sample. For example, cell-free nucleic acids (cfRNA molecules) can be extracted and purified using one or more known commercial protocols or kits, such as the QIAamp Circulating Nucleic Acid Kit (Qiagen). After extraction, the cfRNA molecules are used to prepare a sequencing library. In one embodiment, a reverse transcription step is used to generate multiple cDNA/RNA hybrid molecules, the RNA strands are degraded to generate single-stranded cDNA molecules, and the second strand is synthesized to generate single-stranded cDNA molecules. A plurality of double-stranded DNA molecules are generated from a template and DNA adapters are ligated to the plurality of double-stranded DNA molecules to generate a sequencing library. As noted above, the DNA adapter includes one or more sequencing oligonucleotides for use in subsequent cluster generation and/or sequencing (e.g., the known P5 and P7 sequences (Illumina, San Diego, Calif.)) may be included. In another embodiment, the adapters contain sample-specific index sequences so that after library preparation the library can be combined with one or more other libraries prepared from individual samples, thereby allowing multiplex sequencing. Sing becomes possible. In another embodiment, a unique molecular identifier (UMI) is added by adapter ligation.

ステップ420で、複数の配列リードを生成するためにシーケンシング反応を実行する。一般に、当技術分野で知られている任意の方法を使用して、シーケンシングライブラリから配列データまたは配列リードを取得することができる。例えば、一実施形態において、シーケンシングライブラリからのシーケンシングデータまたは配列リードは、次世代シーケンシング(NGS)を使用して取得できる。次世代シーケンシング法には、例えば、合成によるシーケンシング技術(Illumina社)、パイロシーケンシング(454)、イオン半導体技術(Ion Torrentシーケンシング)、単一分子リアルタイムシーケンシング(Pacific Biosciences社)、ライゲーションによるシーケンシング(SOLiDシーケンシング)、およびナノポアシーケンシング(Oxford Nanopore Technologies社)が含まれる。いくつかの実施形態において、シーケンシングは、可逆的なダイターミネータを用いた合成によるシーケンシングを使用する大規模並列シーケンシングである。他の実施形態において、シーケンシングはライゲーションによるシーケンシングである。さらに他の実施形態では、シーケンシングは単一分子シーケンシングである。さらに別の実施形態において、シーケンシングはペアエンドシーケンシングである。任意に、シーケンシングの前に増幅ステップを実行することができる。 At step 420, a sequencing reaction is performed to generate multiple sequence reads. In general, any method known in the art can be used to obtain sequence data or sequence reads from a sequencing library. For example, in one embodiment, sequencing data or sequence reads from a sequencing library can be obtained using next generation sequencing (NGS). Next-generation sequencing methods include, for example, sequencing-by-synthesis technology (Illumina), pyrosequencing (454), ion semiconductor technology (Ion Torrent sequencing), single-molecule real-time sequencing (Pacific Biosciences), ligation (SOLiD sequencing), and nanopore sequencing (Oxford Nanopore Technologies). In some embodiments, the sequencing is massively parallel sequencing using sequencing-by-synthesis with reversible dye terminators. In other embodiments, the sequencing is sequencing by ligation. In still other embodiments, the sequencing is single molecule sequencing. In yet another embodiment, the sequencing is paired-end sequencing. Optionally, an amplification step can be performed prior to sequencing.

ステップ425で非除外配列リードのリストを生成するためにcfRNAサンプルから得られた配列リードをフィルタリングし、ステップ430で非除外配列リードを定量化する。例えば、本明細書の他の場所に記載されているように、健常細胞に存在することが知られている配列を除外するために、cfRNAサンプルから得られた配列リードをフィルタリングすることができる。一実施形態において、健常細胞(例えば、白血球)から抽出されたRNA分子をシーケンシングし、cfRNA由来の配列リードから除外された配列リードを導き出し、非除外配列リードを取得する。別の実施形態において、データベース(例えば、公共データベース)からのRNAシーケンシングデータを使用して、健常細胞のリードに存在することが知られている配列をフィルタリングまたは除外し、非除外配列リードを取得することができる。 The sequence reads obtained from the cfRNA sample are filtered to generate a list of non-excluded sequence reads in step 425 and the non-excluded sequence reads are quantified in step 430 . For example, sequence reads obtained from cfRNA samples can be filtered to exclude sequences known to be present in healthy cells, as described elsewhere herein. In one embodiment, RNA molecules extracted from healthy cells (eg, leukocytes) are sequenced to derive excluded sequence reads from cfRNA-derived sequence reads to obtain non-excluded sequence reads. In another embodiment, RNA sequencing data from databases (e.g., public databases) are used to filter or exclude sequences known to be present in healthy cell reads to obtain non-excluded sequence reads. can do.

ステップ435で、定量化された非除外配列リードが閾値を超える場合に疾患状態を検出する。さまざまな実施形態において、閾値は、約または正確に1~約または正確に10の範囲の整数であり、例えば、約もしくは正確に2、3、4、5、6、7、8、または約もしくは正確に9である。いくつかの実施形態において、閾値は、約または正確に0.1~約または正確に0.9の範囲の非整数値であり、例えば、約もしくは正確に0.2、0.3、0.4、0.5、0.6、0.7、または約もしくは正確に0.8である。 At step 435, a disease state is detected if the quantified non-excluded sequence reads exceed a threshold. In various embodiments, the threshold is an integer ranging from about or exactly 1 to about or exactly 10, such as about or exactly 2, 3, 4, 5, 6, 7, 8, or about or Exactly nine. In some embodiments, the threshold is a non-integer value in the range of about or exactly 0.1 to about or exactly 0.9, eg, about or exactly 0.2, 0.3, 0.9. 4, 0.5, 0.6, 0.7, or about or exactly 0.8.

本開示の態様は、癌を有することが知られている、または癌を有すると疑われる対象において、癌の存在を検出する、癌のステージを決定する、癌の進行を監視する、および/または癌の種類を決定する方法に関する。いくつかの実施形態において、前記方法は(a)対象からの生物学的試験サンプル中の複数のcfRNA分子からの複数の配列リードを取得すること;(b)生物学的試験サンプル中の1つ以上のRNAマーカーに由来する1つ以上の配列の存在を定量的に検出して、腫瘍RNAスコアを決定することであって、前記1つ以上のRNAマーカーは1つ以上の標的化RNA分子からなる群から選択される、決定すること;および(c)腫瘍RNAスコアが閾値を超えた場合に、対象における、癌の存在を検出する、癌のステージを決定する、癌の進行を監視する、および/または癌の種類を決定すること;を含む。さまざまな実施形態において、約または正確に1~約または正確に10の範囲の整数であり、例えば、約もしくは正確に2、3、4、5、6、7、8、または約もしくは正確に9である。いくつかの実施形態において、閾値は、約または正確に0.1~約または正確に0.9の範囲の非整数値であり、例えば、約もしくは正確に0.2、0.3、0.4、0.5、0.6、0.7、または約もしくは正確に0.8である。 Aspects of the present disclosure detect the presence of cancer, determine the stage of cancer, monitor the progression of cancer, and/or It relates to a method of determining the type of cancer. In some embodiments, the method comprises (a) obtaining multiple sequence reads from multiple cfRNA molecules in a biological test sample from the subject; (b) one in the biological test sample determining a tumor RNA score by quantitatively detecting the presence of one or more sequences derived from the above RNA markers, wherein the one or more RNA markers are from one or more targeted RNA molecules. and (c) detecting the presence of cancer, determining the stage of cancer, monitoring progression of cancer in the subject if the tumor RNA score exceeds a threshold value. and/or determining the type of cancer; In various embodiments, an integer ranging from about or exactly 1 to about or exactly 10, such as about or exactly 2, 3, 4, 5, 6, 7, 8, or about or exactly 9 is. In some embodiments, the threshold is a non-integer value in the range of about or exactly 0.1 to about or exactly 0.9, eg, about or exactly 0.2, 0.3, 0.9. 4, 0.5, 0.6, 0.7, or about or exactly 0.8.

本開示の実施形態による定量的検出方法は、次世代シーケンシングなどの核酸シーケンシング手順を含むことができる。さまざまな実施形態において、シーケンシングは、全トランスクリプトームシーケンシングを含み得る。さまざまな実施形態において、シーケンシングは、シーケンシング手順を実行する前に、目的の1つ以上の標的化RNA配列についてサンプルを濃縮することを含み得る。あるいは、当業者であれば容易に理解されるように、配列リードを検出および定量化するための他の手段、例えば、アレイベースのハイブリダイゼーション、プローブベースの溶液中ハイブリダイゼーション、ライゲーションベースのアッセイ、プライマー伸長反応アッセイが、(例えば、RNA分子から変換された)DNA分子から配列リードを決定するために使用され得る。 Quantitative detection methods according to embodiments of the present disclosure can include nucleic acid sequencing procedures such as next generation sequencing. In various embodiments, sequencing can include whole transcriptome sequencing. In various embodiments, sequencing can include enriching the sample for one or more targeted RNA sequences of interest prior to performing a sequencing procedure. Alternatively, other means for detecting and quantifying sequence reads, such as array-based hybridization, probe-based in-solution hybridization, ligation-based assays, as will be readily appreciated by those skilled in the art. Primer extension assays can be used to determine sequence reads from DNA molecules (eg, converted from RNA molecules).

図5は、本開示の別の実施形態による、1つ以上の標的化RNA分子由来の1つ以上の配列リードから疾患状態を検出する方法を示すフローダイアグラムである。ステップ510で、複数の無細胞RNA分子を含む生物学的試験サンプルを取得する。一実施形態において、生物学的試験サンプルは、体液(例えば、血液、血漿、血清、尿、唾液、胸水、心膜液、脳脊髄液(CSF)、腹水サンプル、またはそれらの任意の組み合わせ)である。 FIG. 5 is a flow diagram showing a method of detecting a disease state from one or more sequence reads derived from one or more targeted RNA molecules, according to another embodiment of the disclosure. At step 510, a biological test sample containing a plurality of cell-free RNA molecules is obtained. In one embodiment, the biological test sample is a bodily fluid (e.g., blood, plasma, serum, urine, saliva, pleural effusion, pericardial fluid, cerebrospinal fluid (CSF), ascites sample, or any combination thereof). be.

ステップ515で、生物学的試験サンプル中の1つ以上の標的RNA分子に由来する1つ以上の核酸配列の存在を検出し、定量化して、腫瘍RNAスコアを決定する。本明細書の他の箇所に記載されているように、RNA分子由来の核酸は、当技術分野で既知の手段を用いて検出および定量化することができる。例えば、一実施形態に従って、RNA分子由来の核酸は、次世代シーケンシングプラットホーム(例えば、HiSeqまたはNovaSeq、Illumina社、サンディエゴ、カリフォルニア州)などのシーケンシング手順を用いて検出および定量化される。他の実施形態において、RNA分子由来の核酸は、マイクロアレイ、逆転写PCR、リアルタイムPCR、定量的リアルタイムPCR、デジタルPCR、デジタル液滴PCR(digital droplet PCR)、デジタルエマルジョンPCR、マルチプレックスPCR、ハイブリッド捕捉(hybrid capture)、オリゴヌクレオチドライゲーションアッセイ、またはそれらの任意の組み合わせを用いて検出および定量化される。一般に、当技術分野で知られている任意の方法を使用して、試験サンプルから無細胞核酸を抽出および精製することができる。他で述べたように、一実施形態において、無細胞核酸(cfRNA分子)は、QIAamp循環核酸キット(Qiagen)などの1つ以上の既知の市販プロトコールまたはキットを使用して抽出および精製できる。抽出後、cfRNA分子を使用してシーケンシングライブラリを調製する。一実施形態において、逆転写ステップを使用して複数のcDNA/RNAハイブリッド分子を作製し、RNA鎖を分解して一本鎖cDNA分子を作製し、第二鎖を合成して一本鎖cDNA分子テンプレートから複数の二本鎖DNA分子を作製する。任意に、1つ以上の標的化RNA分子(またはそれに由来するDNA分子)は、本明細書の他の箇所に記載されているように、検出および定量化の前に濃縮される。 At step 515, the presence of one or more nucleic acid sequences derived from one or more target RNA molecules in the biological test sample is detected and quantified to determine a tumor RNA score. As described elsewhere herein, nucleic acids from RNA molecules can be detected and quantified using means known in the art. For example, according to one embodiment, nucleic acids from RNA molecules are detected and quantified using sequencing procedures such as next-generation sequencing platforms (eg, HiSeq or NovaSeq, Illumina, San Diego, Calif.). In other embodiments, nucleic acids derived from RNA molecules are used in microarray, reverse transcription PCR, real-time PCR, quantitative real-time PCR, digital PCR, digital droplet PCR, digital emulsion PCR, multiplex PCR, hybrid capture. (hybrid capture), oligonucleotide ligation assays, or any combination thereof. Generally, any method known in the art can be used to extract and purify cell-free nucleic acids from a test sample. As noted elsewhere, in one embodiment, cell-free nucleic acids (cfRNA molecules) can be extracted and purified using one or more known commercial protocols or kits, such as the QIAamp Circulating Nucleic Acid Kit (Qiagen). After extraction, the cfRNA molecules are used to prepare a sequencing library. In one embodiment, a reverse transcription step is used to generate multiple cDNA/RNA hybrid molecules, the RNA strands are degraded to generate single-stranded cDNA molecules, and the second strand is synthesized to generate single-stranded cDNA molecules. A plurality of double-stranded DNA molecules are generated from the template. Optionally, one or more targeting RNA molecules (or DNA molecules derived therefrom) are enriched prior to detection and quantification as described elsewhere herein.

一実施形態において、腫瘍RNAスコアは、検出された標的化RNA分子(または標的化RNA分子に由来するDNA分子から得られた配列リード)の量または数である。別の実施形態において、腫瘍RNAスコアは、検出された標的化RNA分子(または標的化RNA分子に由来するDNA分子から得られた配列リード)の総数を、RNA分子が標的化されている遺伝子の総数で割った平均値、最頻値、または平均を含む。さらに他の実施形態において、腫瘍RNAスコアは、配列リードを予測モデルに入力することによって決定され、腫瘍RNAスコアは、本明細書の他の箇所で説明するように、尤度または確率として出力される。 In one embodiment, the tumor RNA score is the amount or number of targeted RNA molecules (or sequence reads obtained from DNA molecules derived from targeted RNA molecules) detected. In another embodiment, the Tumor RNA Score is the total number of detected targeting RNA molecules (or sequence reads obtained from DNA molecules derived from targeting RNA molecules) divided by the number of genes to which the RNA molecules are targeted. Includes the mean, mode, or mean divided by the total number. In yet other embodiments, the tumor RNA score is determined by inputting sequence reads into a predictive model, and the tumor RNA score is output as a likelihood or probability as described elsewhere herein. be.

ステップ520で、前記腫瘍RNAスコアが閾値を超えた場合に、対象における、癌の存在を検出する、癌の状態を決定する、癌の進行を監視する、および/または、癌の種類を決定する。閾値は、約または正確に1~約または正確に10の範囲の整数であり得、例えば、約もしくは正確に2、3、4、5、6、7、8、または約もしくは正確に9であり得る。いくつかの実施形態において、閾値は、約または正確に0.1~約または正確に0.9の範囲の非整数値であり、例えば、約もしくは正確に0.2、0.3、0.4、0.5、0.6、0.7、または約もしくは正確に0.8である。あるいは、腫瘍RNAスコアが予測モデルから出力される場合、その出力は単に、対象が癌または癌の種類を有する可能性または確率を示す尤度または確率であり得る。 At step 520, detecting the presence of cancer, determining cancer status, monitoring cancer progression, and/or determining cancer type in a subject if said tumor RNA score exceeds a threshold. . The threshold can be an integer ranging from about or exactly 1 to about or exactly 10, such as about or exactly 2, 3, 4, 5, 6, 7, 8, or about or exactly 9. obtain. In some embodiments, the threshold is a non-integer value in the range of about or exactly 0.1 to about or exactly 0.9, eg, about or exactly 0.2, 0.3, 0.9. 4, 0.5, 0.6, 0.7, or about or exactly 0.8. Alternatively, if a tumor RNA score is output from a predictive model, the output may simply be a likelihood or probability indicating the likelihood or probability that the subject has cancer or cancer type.

癌指標スコア
本開示の態様は、患者における癌の存在を検出するためのコンピュータ実装方法に関する。いくつかの実施形態において、前記方法は、プロセッサおよびコンピュータ可読媒体を含むコンピュータでデータセットを受け取ることを含み、該データセットは、患者からの生物学的試験サンプル中の複数の標的化リボ核酸(RNA)分子に由来する複数の核酸分子(例えば、DNA分子)をシーケンシングすることによって得られた複数の配列リードを含み、該コンピュータ可読媒体は、プロセッサにより実行されるとき、コンピュータに以下を行わせる命令を含む:生物学的試験サンプルからの複数の標的化RNA分子の発現レベルを決定すること;標的化RNA分子の各々の発現レベルをRNA組織スコア行列と比較して、各標的RNA分子の癌指標スコアを決定すること;各標的化RNA分子の癌指標スコアを集計して、生物学的試験サンプルの癌指標スコアを生成すること;および生物学的試験サンプルの癌指標スコアが閾値を超えた場合に、患者における癌の存在を検出すること。
Cancer Index Score Aspects of the present disclosure relate to computer-implemented methods for detecting the presence of cancer in a patient. In some embodiments, the method includes receiving a dataset in a computer comprising a processor and computer readable medium, the dataset comprising a plurality of targeted ribonucleic acids in a biological test sample from a patient ( comprising a plurality of sequence reads obtained by sequencing a plurality of nucleic acid molecules (e.g., DNA molecules) derived from a RNA) molecule, the computer readable medium, when executed by a processor, causes the computer to: determining the expression level of a plurality of targeted RNA molecules from a biological test sample; comparing the expression level of each of the targeted RNA molecules to the RNA tissue score matrix to determine the determining a cancer index score; aggregating the cancer index score for each targeted RNA molecule to generate a cancer index score for the biological test sample; detecting the presence of cancer in a patient if

いくつかの実施形態において、標的RNA分子は、既知の癌状態を有する患者において、健常患者における発現レベルを超える発現レベルを有する。さまざまな実施形態において、既知の癌状態を有する患者における標的RNA分子の発現レベルは、健常患者における標的RNA分子の発現レベルの約または正確に2倍~約または正確に10倍の範囲、例えば、約もしくは正確に3、4、5、6、7、8倍、または約もしくは正確に9倍である。さまざまな実施形態において、標的RNA分子は、健常患者からの生物学的試験サンプルでは検出できない、すなわち、標的RNA分子は検出不可能な発現レベルを有する。 In some embodiments, the target RNA molecule has a level of expression in patients with a known cancer condition that exceeds the level of expression in healthy patients. In various embodiments, the expression level of the target RNA molecule in a patient with a known cancer condition ranges from about or exactly 2-fold to about or exactly 10-fold the expression level of the target RNA molecule in a healthy patient, e.g. About or exactly 3, 4, 5, 6, 7, 8 times, or about or exactly 9 times. In various embodiments, the target RNA molecule is undetectable in a biological test sample from a healthy patient, ie, the target RNA molecule has an undetectable expression level.

いくつかの実施形態において、生物学的試験サンプル中の標的RNA分子の数は、約もしくは正確に1~約もしくは正確に2000、約もしくは正確に10~約もしくは正確に1000、約もしくは正確に10~約もしくは正確に500、または約もしくは正確に10~約もしくは正確に500の範囲である。他の実施形態において、標的RNA分子の数は、約もしくは正確に1~約もしくは正確に50、約もしくは正確に1~約もしくは正確に40、約もしくは正確に1~約もしくは正確に30、または約もしくは正確に1~約もしくは正確に20の範囲、例えば、約もしくは正確に2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または約もしくは正確に20である。 In some embodiments, the number of target RNA molecules in the biological test sample is about or exactly 1 to about or exactly 2000, about or exactly 10 to about or exactly 1000, about or exactly 10 to about or exactly 500, or about or exactly 10 to about or exactly 500. In other embodiments, the number of target RNA molecules is about or exactly 1 to about or exactly 50, about or exactly 1 to about or exactly 40, about or exactly 1 to about or exactly 30, or about or exactly 1 to about or exactly 20, such as about or exactly 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, or about or exactly 20.

いくつかの実施形態において、癌指標スコアは、生物学的試験サンプルから検出された標的化RNA分子(または標的化RNA分子に由来するDNA分子から得られた配列リード)の総数の集計を含む。別の実施形態において、癌指標スコアは、検出された標的化RNA分子(または標的化RNA分子に由来するDNA分子から得られた配列リード)の総数を、RNA分子が標的化されている遺伝子の総数で割った平均値、最頻値、または平均を含む。さらに他の実施形態において、癌指標スコアは、配列リードを予測モデルに入力することによって決定され、癌指標スコアは、本明細書の他の箇所で説明するように、尤度または確率として出力される。 In some embodiments, the cancer index score comprises an aggregation of the total number of targeted RNA molecules (or sequence reads obtained from DNA molecules derived from the targeted RNA molecules) detected from the biological test sample. In another embodiment, the cancer index score is the total number of detected targeted RNA molecules (or sequence reads obtained from DNA molecules derived from targeted RNA molecules) compared to the number of genes to which the RNA molecules are targeted. Includes the mean, mode, or mean divided by the total number. In yet other embodiments, cancer index scores are determined by inputting sequence reads into a predictive model, and cancer index scores are output as likelihoods or probabilities as described elsewhere herein. be.

いくつかの実施形態において、閾値は、約1~約10の範囲の整数、例えば、約もしくは正確に2、3、4、5、6、7、8、または約もしくは正確に9である。いくつかの実施形態において、閾値は、約または正確に0.1~約または正確に0.9の範囲の非整数値、例えば、約もしくは正確に0.2、0.3、0.4、0.5、0.6、0.7、または約もしくは正確に0.8である。他の実施形態において、閾値は、約または正確に0.5~約または正確に5リード・パー・ミリオン(RPM)の範囲、例えば、約もしくは正確に1、1.5、2、2.5、3、3.5、4、または約もしくは正確に4.5RPMである。癌ロケータースコア閾値は、対照サンプル、例えば健常対象または既知の疾患状態を有する対象において検出された標的化RNA分子(またはそれに由来する配列リード)の量に基づいて決定することができる。あるいは、癌ロケータースコアが予測モデルから出力される場合、その出力は、単純に、対象が癌または癌の種類を有する可能性または確率を示す尤度または確率であり得る。 In some embodiments, the threshold is an integer ranging from about 1 to about 10, such as about or exactly 2, 3, 4, 5, 6, 7, 8, or about or exactly 9. In some embodiments, the threshold is a non-integer value ranging from about or exactly 0.1 to about or exactly 0.9, such as about or exactly 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, or about or exactly 0.8. In other embodiments, the threshold ranges from about or exactly 0.5 to about or exactly 5 reads per million (RPM), such as about or exactly 1, 1.5, 2, 2.5 , 3, 3.5, 4, or about or exactly 4.5 RPM. A cancer locator score threshold can be determined based on the amount of targeted RNA molecules (or sequence reads derived therefrom) detected in a control sample, e.g., a healthy subject or a subject with a known disease state. Alternatively, when a cancer locator score is output from a predictive model, the output can simply be a likelihood or probability indicating the likelihood or probability that a subject has cancer or type of cancer.

図6は、本開示の一実施形態による、癌指標スコアに基づいて対象における癌の存在を検出する方法を示すフローダイアグラムである。ステップ610で、生物学的試験サンプル中の複数のcfRNA分子に由来する複数の配列リードを含むデータセットを受け取る。例えば、本明細書に記載されるように、生物学的試験サンプルから抽出された複数のcfRNA分子について複数の配列リードを決定することができる。さらに、cfRNA分子は逆転写されてDNA分子を生成し、該DNA分子がシーケンシングされて配列リードが生成される。 FIG. 6 is a flow diagram illustrating a method of detecting the presence of cancer in a subject based on a cancer index score, according to one embodiment of the present disclosure; At step 610, a data set is received that includes multiple sequence reads from multiple cfRNA molecules in a biological test sample. For example, as described herein, multiple sequence reads can be determined for multiple cfRNA molecules extracted from a biological test sample. In addition, the cfRNA molecule is reverse transcribed to produce a DNA molecule, which is sequenced to produce sequence reads.

ステップ615では、生物学的試験サンプル中の複数の標的RNA分子の発現レベルが決定される。例えば、一実施形態において、標的化RNA分子の発現レベルは、1つ以上の目的の標的化RNA分子に由来する検出された配列リードの定量化に基づいて決定され得る。 At step 615, expression levels of a plurality of target RNA molecules in the biological test sample are determined. For example, in one embodiment, the expression level of a targeting RNA molecule can be determined based on quantification of detected sequence reads derived from one or more targeting RNA molecules of interest.

ステップ620で、標的RNA分子の各々の発現レベルをRNA組織スコア行列と比較して、各標的RNA分子の癌指標スコアを決定する。RNA組織スコア行列は、既知の癌状態を有する複数の癌訓練サンプルに由来する配列リードを含む訓練セットから決定され得る。 At step 620, the expression level of each of the target RNA molecules is compared to the RNA tissue score matrix to determine a cancer index score for each target RNA molecule. An RNA tissue score matrix can be determined from a training set containing sequence reads from multiple cancer training samples with known cancer status.

ステップ625で、各標的RNA分子の癌指標スコアが集計されて、癌指標スコアが生成される。いくつかの実施形態において、癌指標スコアは、生物学的試験サンプルから検出された標的RNA分子(または標的RNA分子に由来するDNA分子から得られた配列リード)の総数の集計を含む。別の実施形態において、癌指標スコアは、検出された標的化RNA分子(または標的化RNA分子に由来するDNA分子から得られた配列リード)の総数を、RNA分子が標的化されている遺伝子の総数で割った平均値、最頻値、または平均を含む。 At step 625, the cancer index scores for each target RNA molecule are aggregated to generate a cancer index score. In some embodiments, the cancer index score comprises an aggregation of the total number of target RNA molecules (or sequence reads obtained from DNA molecules derived from the target RNA molecules) detected from the biological test sample. In another embodiment, the cancer index score is the total number of detected targeted RNA molecules (or sequence reads obtained from DNA molecules derived from targeted RNA molecules) compared to the number of genes to which the RNA molecules are targeted. Includes the mean, mode, or mean divided by the total number.

ステップ630で、試験サンプルの癌指標スコアが閾値を超えた場合に、対象における癌の存在を検出する。上述したように、一実施形態において、閾値は、約または正確に1~約または正確に10の範囲の整数、例えば、約もしくは正確に2、3、4、5、6、7、8、または約もしくは正確に9である。いくつかの実施形態において、閾値は、約または正確に0.1~約または正確に0.9の範囲の非整数値、例えば、約もしくは正確に0.2、0.3、0.4、0.5、0.6、0.7、または約もしくは正確に0.8である。他の実施形態において、閾値は、約または正確に0.5~約または正確に5リード・パー・ミリオン(RPM)の範囲、例えば、約もしくは正確に1、1.5、2、2.5、3、3.5、4、または約もしくは正確に4.5RPMである。 At step 630, the presence of cancer in the subject is detected when the test sample's cancer index score exceeds a threshold. As noted above, in one embodiment, the threshold is an integer ranging from about or exactly 1 to about or exactly 10, such as about or exactly 2, 3, 4, 5, 6, 7, 8, or About or exactly nine. In some embodiments, the threshold is a non-integer value ranging from about or exactly 0.1 to about or exactly 0.9, such as about or exactly 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, or about or exactly 0.8. In other embodiments, the threshold ranges from about or exactly 0.5 to about or exactly 5 reads per million (RPM), such as about or exactly 1, 1.5, 2, 2.5 , 3, 3.5, 4, or about or exactly 4.5 RPM.

本開示の態様は、標的RNA分子の1つ以上の発現レベル、標的RNA分子の1つ以上の癌指標スコア、生物学的試験サンプルの癌指標スコア、またはそれらの任意の組み合わせに基づいて、患者における癌細胞の種類または癌の起源組織を決定するための方法を含む。さまざまな実施形態において、前記方法は、標的RNA分子の1つ以上の発現レベル、標的RNA分子の1つ以上の癌指標スコア、生物学的試験サンプルの癌指標スコア、またはそれらの任意の組み合わせに基づいて、複数の処置カテゴリーのうちの1つ以上に患者を治療的に分類することをさらに含む。 Aspects of the present disclosure provide a method for determining, based on one or more expression levels of a target RNA molecule, one or more cancer index scores of a target RNA molecule, a cancer index score of a biological test sample, or any combination thereof, methods for determining the type of cancer cell or the tissue of origin of the cancer in . In various embodiments, the method comprises determining the expression levels of one or more of the target RNA molecules, one or more cancer index scores of the target RNA molecules, cancer index scores of the biological test sample, or any combination thereof. Further comprising therapeutically classifying the patient into one or more of a plurality of treatment categories based on.

さまざまな実施形態において、コンピュータは、標的RNA分子の1つ以上の発現レベル、標的RNA分子の1つ以上の癌指標スコア、生物学的試験サンプルの癌指標スコア、患者における癌の存在または非存在の表示、患者における癌の起源組織の癌細胞タイプの表示、患者の治療分類、またはそれらの任意の組み合わせを含む報告書を生成するように構成される。 In various embodiments, the computer calculates the expression levels of one or more of the target RNA molecules, the one or more cancer index scores of the target RNA molecules, the cancer index scores of the biological test sample, the presence or absence of cancer in the patient. , an indication of the cancer cell type of the tissue of origin of the cancer in the patient, the treatment classification of the patient, or any combination thereof.

RNA組織行列スコア
本開示の態様は、RNA組織スコア行列を構築する方法を含む。いくつかの実施形態において、前記方法は、複数の患者から得られた複数のRNA配列リードを編集してRNA発現行列を生成すること、および/またはRNA発現行列を組織特異的RNA発現行列で正規化してRNA組織スコア行列を構築することを含む。いくつかの実施形態において、組織特異的RNA発現行列は、複数の参照ヒト組織を含む。さまざまな実施形態において、複数の健常患者からRNA配列リードを取得して、健常RNA組織スコア行列を構築する。さまざまな実施形態において、既知の癌の種類を有する複数の患者からRNA配列リードを取得して、癌RNA組織スコア行列を構築する。
RNA Tissue Matrix Scores Aspects of the present disclosure include methods of constructing RNA tissue score matrices. In some embodiments, the method comprises compiling a plurality of RNA sequence reads obtained from a plurality of patients to generate an RNA expression matrix and/or normalizing the RNA expression matrix with a tissue-specific RNA expression matrix. constructing an RNA tissue score matrix. In some embodiments, the tissue-specific RNA expression matrix comprises multiple reference human tissues. In various embodiments, RNA sequence reads are obtained from multiple healthy patients to construct a healthy RNA tissue score matrix. In various embodiments, RNA sequence reads are obtained from multiple patients with known cancer types to construct a cancer RNA tissue score matrix.

RANマーカーと分析技術
本開示のいくつかの実施形態による方法は、cfRNA分子および/またはctRNA分子に対して実行することができる。いくつかの実施形態において、本発明の方法で使用されるRNA分子には、癌性細胞および非癌性細胞からのRNA分子が含まれる。
RAN Markers and Analysis Techniques Methods according to some embodiments of the present disclosure can be performed on cfRNA and/or ctRNA molecules. In some embodiments, RNA molecules used in the methods of the invention include RNA molecules from cancerous and non-cancerous cells.

実施形態において、方法は、(a)複数の標的cfRNA分子またはそのcDNA分子を濃縮して、ポリヌクレオチドの濃縮サンプルを生成すること;および/または(b)該濃縮サンプルのポリヌクレオチドまたはその増幅産物をシーケンシングすることを含み、複数の標的cfRNA分子は、表11の1つ以上の転写産物から選択される。実施形態において、複数の標的cfRNA分子が、表8および表12~15のうちの1つ以上(例えば、表8および表11~14のうちの1つ以上に記載された5、10、15または20個の遺伝子の転写産物)から選択される。実施形態において、複数のcfRNA分子を測定することは、シーケンシングなどによって、検出または測定の前に複数のcfRNA分子(またはそのcDNA分子)を濃縮することを含む。実施形態において、測定される標的cfRNA分子は、500個以下の遺伝子(例えば、400個以下、300個以下、200個以下、100個以下または50個以下の遺伝子)に由来する。 In embodiments, the method comprises (a) enriching a plurality of target cfRNA molecules or cDNA molecules thereof to produce an enriched sample of polynucleotides; and/or (b) polynucleotides or amplification products thereof of said enriched sample. and the plurality of target cfRNA molecules is selected from one or more transcripts of Table 11. In embodiments, the plurality of target cfRNA molecules is one or more of Tables 8 and 12-15 (e.g., 5, 10, 15 or 20 gene transcripts). In embodiments, measuring the plurality of cfRNA molecules comprises enriching the plurality of cfRNA molecules (or cDNA molecules thereof) prior to detection or measurement, such as by sequencing. In embodiments, the target cfRNA molecules that are measured are derived from 500 or fewer genes (eg, 400 or fewer, 300 or fewer, 200 or fewer, 100 or fewer, or 50 or fewer genes).

実施形態において、方法は、対象のサンプル中の複数の標的無細胞RNA(cfRNA)分子を測定することであって、該複数の標的cfRNA分子は表8および11~14の転写産物から選択される、測定すること;および(b)閾値レベルを超える標的cfRNA分子の1つ以上を検出することを含む、癌を検出すること;を含む。実施形態において、複数の標的cfRNA分子は、表8および11~14のうちの1つ以上に列挙された少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50個またはそれ以上の遺伝子から選択される転写産物である。標的cfRNA分子は、これらの表のいずれか1つ、またはそれらの組み合わせから選択される遺伝子に由来し得る。実施形態において、表8および11~14の中から選択される表の数は、2つ、3つ、4つもしくはすべての表、または表の任意の組み合わせである。実施形態において、複数のcfRNA分子を測定することは、全トランスクリプトームシーケンシングを含まない。実施形態において、複数のcfRNA分子を測定することは、シーケンシングなどによって、検出または測定の前に複数のcfRNA分子(またはそのcDNA分子)を濃縮することを含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400個未満、300個未満、200個未満、100個未満または50個未満の遺伝子)に由来する。 In embodiments, the method is measuring a plurality of target cell-free RNA (cfRNA) molecules in a sample of a subject, said plurality of target cfRNA molecules being selected from the transcripts of Tables 8 and 11-14 , measuring; and (b) detecting cancer comprising detecting one or more of the target cfRNA molecules above a threshold level. In embodiments, the plurality of target cfRNA molecules is at least 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, listed in one or more of Tables 8 and 11-14. Transcripts selected from 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 50 or more genes. A target cfRNA molecule can be derived from a gene selected from any one of these tables, or a combination thereof. In embodiments, the number of tables selected from among Tables 8 and 11-14 is two, three, four or all tables, or any combination of tables. In embodiments, measuring the plurality of cfRNA molecules does not comprise whole transcriptome sequencing. In embodiments, measuring the plurality of cfRNA molecules comprises enriching the plurality of cfRNA molecules (or cDNA molecules thereof) prior to detection or measurement, such as by sequencing. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, less than 300, less than 200, less than 100, or less than 50 genes).

いくつかの実施形態において、1つ以上の標的cfRNA分子は、表1に列挙された遺伝子から選択される1つ以上の遺伝子に由来する。実施形態において、1つ以上の標的cfRNA分子は、表1の少なくとも2、3、4、5、6、7、8、9、10、15、20、25または30個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表1の少なくとも5つの遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表1の少なくとも10個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表1のすべての遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表1の最初の5つの遺伝子(AGR2、HOXC10、S100A7、BPIFA1、および/またはIDI2-AS1)のうちの少なくとも1つ、および任意に表1の1つ以上の追加の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、AGR2遺伝子の転写産物を含む。実施形態において、1つ以上の標的cfRNA分子は、AGR2、HOXC10、S100A7、BPIFA1およびIDI2-AS1の転写産物を含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。以下の表1は、癌ダークチャネルバイオマーカーの例を提供する。 In some embodiments, one or more target cfRNA molecules are derived from one or more genes selected from the genes listed in Table 1. In embodiments, the one or more target cfRNA molecules comprise at least 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 or 30 genes of Table 1. In embodiments, the one or more target cfRNA molecules comprise at least 5 genes of Table 1. In embodiments, the one or more target cfRNA molecules comprise at least 10 genes of Table 1. In embodiments, the one or more target cfRNA molecules comprise all genes in Table 1. In embodiments, the one or more target cfRNA molecules are at least one of the first five genes of Table 1 (AGR2, HOXC10, S100A7, BPIFA1, and/or IDI2-AS1), and optionally Include one or more additional genes. In embodiments, the one or more target cfRNA molecules comprise transcripts of the AGR2 gene. In embodiments, the one or more target cfRNA molecules comprise transcripts of AGR2, HOXC10, S100A7, BPIFA1 and IDI2-AS1. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes). Table 1 below provides examples of cancer dark channel biomarkers.

Figure 2021257729000001
Figure 2021257729000001

いくつかの実施形態において、1つ以上の標的cfRNA分子は、表2に列挙された遺伝子から選択される1つ以上の遺伝子に由来する。実施形態において、1つ以上の標的cfRNA分子は、表2の少なくとも2、3、4、5、6、7、8、9または10個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表2の少なくとも5つの遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表2の少なくとも10個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表2のすべての遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表2の最初の5つの遺伝子(ROS1、NKX2-1、GGTLC1、SLC34A2、およびSFTPA2)のうちの少なくとも1つ、および任意に表2の1つ以上の追加の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、ROS1遺伝子の転写産物を含む。実施形態において、1つ以上の標的cfRNA分子は、ROS1、NKX2-1、GGTLC1、SLC34A2およびSFTPA2の転写産物を含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。以下の表2は、ダークチャネル肺癌バイオマーカーの例を提供する。 In some embodiments, one or more target cfRNA molecules are derived from one or more genes selected from the genes listed in Table 2. In embodiments, the one or more target cfRNA molecules comprise at least 2, 3, 4, 5, 6, 7, 8, 9 or 10 genes of Table 2. In embodiments, the one or more target cfRNA molecules comprise at least 5 genes of Table 2. In embodiments, the one or more target cfRNA molecules comprise at least 10 genes of Table 2. In embodiments, the one or more target cfRNA molecules comprise all genes in Table 2. In embodiments, the one or more target cfRNA molecules are at least one of the first five genes of Table 2 (ROS1, NKX2-1, GGTLC1, SLC34A2, and SFTPA2) and optionally one of Table 2 Including the above additional genes. In embodiments, the one or more target cfRNA molecules comprise transcripts of the ROS1 gene. In embodiments, the one or more target cfRNA molecules comprise transcripts of ROS1, NKX2-1, GGTLC1, SLC34A2 and SFTPA2. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes). Table 2 below provides examples of dark channel lung cancer biomarkers.

Figure 2021257729000002
Figure 2021257729000002

いくつかの実施形態において、1つ以上の標的cfRNA分子は、表3に列挙された遺伝子から選択される1つ以上の遺伝子に由来する。実施形態において、1つ以上の標的cfRNA分子は、表3の少なくとも2、3、4、5、6、7、8または9つの遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表3の少なくとも5つの遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表3のすべての遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表3の最初の5つの遺伝子(SCGB2A2、CSN1S1、VTCN1、FABP7、およびLALBA)のうちの少なくとも1つ、および任意に表3の1つ以上の追加の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、SCGB2A2遺伝子の転写産物を含む。実施形態において、1つ以上の標的cfRNA分子は、SCGB2A2、CSN1S1、VTCN1、FABP7およびLALBAの転写産物を含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。以下の表3は、乳癌ダークチャネルバイオマーカーの例を提供する。 In some embodiments, one or more target cfRNA molecules are derived from one or more genes selected from the genes listed in Table 3. In embodiments, the one or more target cfRNA molecules comprise at least 2, 3, 4, 5, 6, 7, 8 or 9 genes of Table 3. In embodiments, the one or more target cfRNA molecules comprise at least 5 genes of Table 3. In embodiments, the one or more target cfRNA molecules comprise all genes in Table 3. In embodiments, the one or more target cfRNA molecules are at least one of the first five genes of Table 3 (SCGB2A2, CSN1S1, VTCN1, FABP7, and LALBA), and optionally one or more of Table 3. Contains additional genes. In embodiments, the one or more target cfRNA molecules comprise transcripts of the SCGB2A2 gene. In embodiments, the one or more target cfRNA molecules comprise transcripts of SCGB2A2, CSN1S1, VTCN1, FABP7 and LALBA. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes). Table 3 below provides examples of breast cancer dark channel biomarkers.

Figure 2021257729000003
Figure 2021257729000003

いくつかの実施形態において、1つ以上の標的cfRNA分子は、表4に列挙された遺伝子から選択される1つ以上の遺伝子に由来する。実施形態において、1つ以上の標的cfRNA分子は、表4の少なくとも2、3、4または5つの遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表4の少なくとも5つの遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表4のすべての遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表4の最初の5つの遺伝子(CASP14、CRABP2、FABP7、SCGB2A2、およびSERPINB5)のうちの少なくとも1つ、および任意に表4の1つ以上の追加の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、CASP14遺伝子の転写産物を含む。実施形態において、1つ以上の標的cfRNA分子は、CASP14、CRABP2、FABP7、SCGB2A2およびSERPINB5の転写産物を含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。以下の表4は、本明細書に記載のヘテロDE法を使用して同定された乳癌バイオマーカーの例を提供する。 In some embodiments, one or more target cfRNA molecules are derived from one or more genes selected from the genes listed in Table 4. In embodiments, the one or more target cfRNA molecules comprise at least 2, 3, 4 or 5 genes of Table 4. In embodiments, the one or more target cfRNA molecules comprise at least 5 genes of Table 4. In embodiments, the one or more target cfRNA molecules comprise all genes in Table 4. In embodiments, the one or more target cfRNA molecules are at least one of the first five genes of Table 4 (CASP14, CRABP2, FABP7, SCGB2A2, and SERPINB5) and optionally one or more of Table 4. Contains additional genes. In embodiments, the one or more target cfRNA molecules comprise a transcript of the CASP14 gene. In embodiments, the one or more target cfRNA molecules comprise transcripts of CASP14, CRABP2, FABP7, SCGB2A2 and SERPINB5. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes). Table 4 below provides examples of breast cancer biomarkers identified using the heteroDE method described herein.

Figure 2021257729000004
Figure 2021257729000004

いくつかの実施形態において、1つ以上の標的cfRNA分子は、表5に列挙された遺伝子から選択される1つ以上の遺伝子に由来する。実施形態において、1つ以上の標的cfRNA分子は、表5の少なくとも2、3、4、5、6、7、8、9、10、15、20または25個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表5の少なくとも5つの遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表5の少なくとも10個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表5のすべての遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表5の最初の5つの遺伝子(PTPRZ1、AGR2、SHANK1、PON1、およびMYO16_AS1)のうちの少なくとも1つ、および任意に表5の1つ以上の追加の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、PTPRZ1遺伝子の転写産物を含む。実施形態において、1つ以上の標的cfRNA分子は、PTPRZ1、AGR2、SHANK1、PON1およびMYO16_AS1の転写産物を含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。以下の表5は、本明細書に記載の情報ゲイン法を使用して同定された肺癌バイオマーカーの例を提供する。 In some embodiments, one or more target cfRNA molecules are derived from one or more genes selected from the genes listed in Table 5. In embodiments, the one or more target cfRNA molecules comprise at least 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 or 25 genes of Table 5. In embodiments, the one or more target cfRNA molecules comprise at least 5 genes of Table 5. In embodiments, the one or more target cfRNA molecules comprise at least 10 genes of Table 5. In embodiments, the one or more target cfRNA molecules comprise all genes in Table 5. In embodiments, the one or more target cfRNA molecules comprise at least one of the first five genes of Table 5 (PTPRZ1, AGR2, SHANK1, PON1, and MYO16_AS1) and optionally one or more of Table 5. Contains additional genes. In embodiments, the one or more target cfRNA molecules comprise transcripts of the PTPRZ1 gene. In embodiments, the one or more target cfRNA molecules comprise transcripts of PTPRZ1, AGR2, SHANK1, PON1 and MYO16_AS1. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes). Table 5 below provides examples of lung cancer biomarkers identified using the information gain method described herein.

Figure 2021257729000005
Figure 2021257729000005

いくつかの実施形態において、1つ以上の標的cfRNA分子は、表6に列挙された遺伝子から選択される1つ以上の遺伝子に由来する。実施形態において、1つ以上の標的cfRNA分子は、表6の少なくとも2、3、4、5、6、7、8、9、10、15、20または25個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表6の少なくとも5つの遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表6の少なくとも10個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表6のすべての遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表6の最初の5つの遺伝子(ADARB2、HORMAD2、SPDYE18、RPS19、およびCYP4F35P)のうちの少なくとも1つ、および任意に表6の1つ以上の追加の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、ADARB2遺伝子の転写産物を含む。実施形態において、1つ以上の標的cfRNA分子は、ADARB2、HORMAD2、SPDYE18、RPS19およびCYP4F35Pの転写産物を含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。以下の表6は、本明細書に記載の情報ゲイン法を使用して同定された乳癌バイオマーカーの例を提供する。 In some embodiments, one or more target cfRNA molecules are derived from one or more genes selected from the genes listed in Table 6. In embodiments, the one or more target cfRNA molecules comprise at least 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 or 25 genes of Table 6. In embodiments, the one or more target cfRNA molecules comprise at least 5 genes of Table 6. In embodiments, the one or more target cfRNA molecules comprise at least 10 genes of Table 6. In embodiments, the one or more target cfRNA molecules comprise all genes in Table 6. In embodiments, the one or more target cfRNA molecules comprise at least one of the first five genes of Table 6 (ADARB2, HORMAD2, SPDYE18, RPS19, and CYP4F35P), and optionally one or more of Table 6. Contains additional genes. In embodiments, the one or more target cfRNA molecules comprise transcripts of the ADARB2 gene. In embodiments, the one or more target cfRNA molecules comprise transcripts of ADARB2, HORMAD2, SPDYE18, RPS19 and CYP4F35P. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes). Table 6 below provides examples of breast cancer biomarkers identified using the information gain methods described herein.

Figure 2021257729000006
Figure 2021257729000006

いくつかの実施形態において、1つ以上の標的cfRNA分子は、表7に列挙された遺伝子から選択される1つ以上の遺伝子に由来する。実施形態において、1つ以上の標的cfRNA分子は、表7の少なくとも2、3、4、5、6、7、8、9または10個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表7の少なくとも5つの遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表7の少なくとも10個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表7のすべての遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表7の最初の5つの遺伝子(S100A7、FOXA1、BARX2、MMP7、およびPLEKHG4B)のうちの少なくとも1つ、および任意に表7の1つ以上の追加の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、S100A7遺伝子の転写産物を含む。実施形態において、1つ以上の標的cfRNA分子は、S100A7、FOXA1、BARX2、MMP7およびPLEKHG4Bの転写産物を含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。以下の表7は、癌組織において比較的高レベルで発現されるダークチャネル癌バイオマーカーの例を提供する。 In some embodiments, one or more target cfRNA molecules are derived from one or more genes selected from the genes listed in Table 7. In embodiments, the one or more target cfRNA molecules comprise at least 2, 3, 4, 5, 6, 7, 8, 9 or 10 genes of Table 7. In embodiments, the one or more target cfRNA molecules comprise at least 5 genes of Table 7. In embodiments, the one or more target cfRNA molecules comprise at least 10 genes of Table 7. In embodiments, the one or more target cfRNA molecules comprise all genes in Table 7. In embodiments, the one or more target cfRNA molecules comprise at least one of the first five genes of Table 7 (S100A7, FOXA1, BARX2, MMP7, and PLEKHG4B) and optionally one or more of Table 7. Contains additional genes. In embodiments, the one or more target cfRNA molecules comprise a transcript of the S100A7 gene. In embodiments, the one or more target cfRNA molecules comprise transcripts of S100A7, FOXA1, BARX2, MMP7 and PLEKHG4B. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes). Table 7 below provides examples of dark channel cancer biomarkers that are expressed at relatively high levels in cancer tissues.

Figure 2021257729000007
Figure 2021257729000007

いくつかの実施形態において、1つ以上の標的cfRNA分子は、表11に列挙された遺伝子から選択される1つ以上の遺伝子に由来する。実施形態において、1つ以上の標的cfRNA分子は、表11の少なくとも2、3、4、5、10、25、50、100、150、200、300または400個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表11の少なくとも5つの遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表11の少なくとも25個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表11の少なくとも100個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表11の少なくとも200個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表11の少なくとも300個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表11のすべての遺伝子を含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。以下の表11は、癌バイオマーカーの例を提供する。 In some embodiments, one or more target cfRNA molecules are derived from one or more genes selected from the genes listed in Table 11. In embodiments, the one or more target cfRNA molecules comprise at least 2, 3, 4, 5, 10, 25, 50, 100, 150, 200, 300 or 400 genes of Table 11. In embodiments, the one or more target cfRNA molecules comprise at least 5 genes of Table 11. In embodiments, the one or more target cfRNA molecules comprise at least 25 genes of Table 11. In embodiments, the one or more target cfRNA molecules comprise at least 100 genes of Table 11. In embodiments, the one or more target cfRNA molecules comprise at least 200 genes of Table 11. In embodiments, the one or more target cfRNA molecules comprise at least 300 genes of Table 11. In embodiments, the one or more target cfRNA molecules comprise all genes in Table 11. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes). Table 11 below provides examples of cancer biomarkers.

Figure 2021257729000008
Figure 2021257729000008

Figure 2021257729000009
Figure 2021257729000009

いくつかの実施形態において、1つ以上の標的cfRNA分子は、表12に列挙された遺伝子から選択される1つ以上の遺伝子に由来する。実施形態において、1つ以上の標的cfRNA分子は、表12の少なくとも2、3、4、5、10、20、30、40、50、または60個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表12の少なくとも5つの遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表12の少なくとも10個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表12の少なくとも25個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表12の少なくとも50個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表12のすべての遺伝子を含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。以下の表12は、肺癌バイオマーカーの例を提供する。 In some embodiments, one or more target cfRNA molecules are derived from one or more genes selected from the genes listed in Table 12. In embodiments, the one or more target cfRNA molecules comprise at least 2, 3, 4, 5, 10, 20, 30, 40, 50, or 60 genes of Table 12. In embodiments, the one or more target cfRNA molecules comprise at least 5 genes of Table 12. In embodiments, the one or more target cfRNA molecules comprise at least 10 genes of Table 12. In embodiments, the one or more target cfRNA molecules comprise at least 25 genes of Table 12. In embodiments, the one or more target cfRNA molecules comprise at least 50 genes of Table 12. In embodiments, the one or more target cfRNA molecules comprise all genes in Table 12. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes). Table 12 below provides examples of lung cancer biomarkers.

Figure 2021257729000010
Figure 2021257729000010

さまざまな実施形態において、1つ以上の標的cfRNA分子は、表13に列挙された遺伝子から選択される1つ以上の遺伝子に由来する。実施形態において、1つ以上の標的cfRNA分子は、表13の少なくとも2、3、4、5、10、20、30、40、50、60、または70個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表13の少なくとも5つの遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表13の少なくとも10個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表13の少なくとも25個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表13の少なくとも50個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表13のすべての遺伝子を含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。以下の表13は、乳癌バイオマーカーの例を提供する。 In various embodiments, one or more target cfRNA molecules are derived from one or more genes selected from the genes listed in Table 13. In embodiments, the one or more target cfRNA molecules comprise at least 2, 3, 4, 5, 10, 20, 30, 40, 50, 60, or 70 genes of Table 13. In embodiments, the one or more target cfRNA molecules comprise at least 5 genes of Table 13. In embodiments, the one or more target cfRNA molecules comprise at least 10 genes of Table 13. In embodiments, the one or more target cfRNA molecules comprise at least 25 genes of Table 13. In embodiments, the one or more target cfRNA molecules comprise at least 50 genes of Table 13. In embodiments, the one or more target cfRNA molecules comprise all genes in Table 13. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes). Table 13 below provides examples of breast cancer biomarkers.

Figure 2021257729000011
Figure 2021257729000011

いくつかの実施形態において、1つ以上の標的cfRNA分子は、表14に列挙された遺伝子から選択される1つ以上の遺伝子に由来する。実施形態において、1つ以上の標的cfRNA分子は、表14の少なくとも2、3、4、5、10、15、20または30個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表14の少なくとも5つの遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表14の少なくとも10個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表14の少なくとも25個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表14のすべての遺伝子を含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。実施形態において、閾値を超えて検出された複数の標的cfRNA分子は、ADIPOQ、AGR3、ANKRD30A、AQP4、BPIFA1、CA12、CEACAM5、CFTR、CXCL17、CYP4F8、FABP7、FOXI1、GGTLC1、GP2、IL20、ITIH6、LDLRAD1、LEMD1、LMX1B、MMP7、NKAIN1、NKX2-1、ROPN1、ROS1、SCGB1D2、SCGB2A2、SFTA2、SFTA3、SLC34A2、SOX9、STK32A、STMND1、TFAP2A、TFAP2B、TFF1、TRPV6、VGLL1およびVTCN1からなる群から選択される複数の遺伝子に由来するcfRNA分子である。以下の表14は、非常に有益な癌バイオマーカーの例を提供する。 In some embodiments, one or more target cfRNA molecules are derived from one or more genes selected from the genes listed in Table 14. In embodiments, the one or more target cfRNA molecules comprise at least 2, 3, 4, 5, 10, 15, 20 or 30 genes of Table 14. In embodiments, the one or more target cfRNA molecules comprise at least 5 genes of Table 14. In embodiments, the one or more target cfRNA molecules comprise at least 10 genes of Table 14. In embodiments, the one or more target cfRNA molecules comprise at least 25 genes of Table 14. In embodiments, the one or more target cfRNA molecules comprise all genes in Table 14. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes). In embodiments, the plurality of target cfRNA molecules detected above the threshold are ADIPOQ, AGR3, ANKRD30A, AQP4, BPIFA1, CA12, CEACAM5, CFTR, CXCL17, CYP4F8, FABP7, FOXI1, GGTLC1, GP2, IL20, ITIH6, LDLRAD1, LEMD1, LMX1B, MMP7, NKAIN1, NKX2-1, ROPN1, ROS1, SCGB1D2, SCGB2A2, SFTA2, SFTA3, SLC34A2, SOX9, STK32A, STMND1, TFAP2A, TFAP2B, TFF1, TRPV6, VGLL1 and VTC selected from the group consisting of N1 cfRNA molecules derived from multiple genes that are Table 14 below provides examples of highly informative cancer biomarkers.

Figure 2021257729000012
Figure 2021257729000012

さまざまな実施形態において、1つ以上の標的cfRNA分子は、表15に列挙された遺伝子から選択される1つ以上の遺伝子に由来する。実施形態において、1つ以上の標的cfRNA分子は、表15の少なくとも2、3、4、5、10、25、50、100、150、200、300または400個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表15の少なくとも5つの遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表15の少なくとも25個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表15の少なくとも100個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表15の少なくとも200個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表15の少なくとも300個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表15のすべての遺伝子を含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。 In various embodiments, one or more target cfRNA molecules are derived from one or more genes selected from the genes listed in Table 15. In embodiments, the one or more target cfRNA molecules comprise at least 2, 3, 4, 5, 10, 25, 50, 100, 150, 200, 300 or 400 genes of Table 15. In embodiments, the one or more target cfRNA molecules comprise at least 5 genes of Table 15. In embodiments, the one or more target cfRNA molecules comprise at least 25 genes of Table 15. In embodiments, the one or more target cfRNA molecules comprise at least 100 genes of Table 15. In embodiments, the one or more target cfRNA molecules comprise at least 200 genes of Table 15. In embodiments, the one or more target cfRNA molecules comprise at least 300 genes of Table 15. In embodiments, the one or more target cfRNA molecules comprise all genes in Table 15. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes).

Figure 2021257729000013
Figure 2021257729000013

Figure 2021257729000014
Figure 2021257729000014

実施形態において、1つ以上の標的cfRNA分子は、表1~6のうちの1つ以上から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)と組み合わせた、表8および11~14のうちの1つ以上から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)に由来する。実施形態において、1つ以上の標的cfRNA分子は、表7から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)と組み合わせた、表8および11~14のうちの1つ以上から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)に由来する。実施形態において、表8および11~14から選択される表は表11である。実施形態において、表8および11~14から選択される表は表12である。実施形態において、表8および11~14から選択される表は表13である。実施形態では、表8および11~14から選択される表は表14である。実施形態において、表8および11~14から選択される表は表13である。実施形態において、表8および11~14から選択される表は表8である。実施形態において、第1および第2の表からの遺伝子の選択は、第1および第2の表の両方で1つ以上の遺伝子を選択することを含む。実施形態において、第1および第2の表からの遺伝子の選択は、第2の表にはない第1の表の1つ以上の遺伝子と、第1の表にはない第2の表の1つ以上の遺伝子とを選択することを含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。 In embodiments, the one or more target cfRNA molecules are one or more genes (eg, 2, 3, 5, or more genes) selected from one or more of Tables 1-6 from one or more genes (eg, 2, 3, 5, or more genes) selected from one or more of Tables 8 and 11-14 in combination with In embodiments, one or more target cfRNA molecules are selected from Tables 8 and 11 in combination with one or more genes selected from Table 7 (e.g., 2, 3, 5, or more genes). from one or more genes (eg, 2, 3, 5, or more genes) selected from 1 or more of -14. In embodiments, the table selected from Tables 8 and 11-14 is Table 11. In embodiments, the table selected from Tables 8 and 11-14 is Table 12. In embodiments, the table selected from Tables 8 and 11-14 is Table 13. In embodiments, the table selected from Tables 8 and 11-14 is Table 14. In embodiments, the table selected from Tables 8 and 11-14 is Table 13. In embodiments, the table selected from Tables 8 and 11-14 is Table 8. In embodiments, selecting genes from the first and second tables comprises selecting one or more genes in both the first and second tables. In embodiments, the selection of genes from the first and second tables includes one or more genes from the first table that are not in the second table and one gene from the second table that is not in the first table. Selecting one or more genes. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes).

実施形態において、癌は肺癌であり、閾値を超えて検出される複数の標的cfRNA分子は、表2、5および12のうちの1つ以上(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)の転写産物から選択される。実施形態において、1つ以上の標的cfRNA分子は、表2、5および12のそれぞれから選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)に由来する。実施形態において、第1および第2の表からの遺伝子の選択は、第1および第2の表の両方で1つ以上の遺伝子を選択することを含む。実施形態において、第1および第2の表からの遺伝子の選択は、第2の表にはない第1の表の1つ以上の遺伝子と、第1の表にはない第2の表の1つ以上の遺伝子とを選択することを含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。 In embodiments, the cancer is lung cancer and the plurality of target cfRNA molecules detected above the threshold is one or more (eg, 2, 3, 5, or more) of Tables 2, 5 and 12. above genes). In embodiments, one or more target cfRNA molecules are derived from one or more genes (e.g., 2, 3, 5, or more genes) selected from each of Tables 2, 5 and 12 do. In embodiments, selecting genes from the first and second tables comprises selecting one or more genes in both the first and second tables. In embodiments, the selection of genes from the first and second tables includes one or more genes from the first table that are not in the second table and one gene from the second table that is not in the first table. Selecting one or more genes. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes).

実施形態において、癌は乳癌であり、閾値を超えて検出される複数の標的cfRNA分子は、表3、4、6および13のうちの1つ以上(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)の転写産物から選択される。実施形態において、1つ以上の標的cfRNA分子は、表3、4、6および13のそれぞれから選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)に由来する。実施形態において、第1および第2の表からの遺伝子の選択は、第1および第2の表の両方で1つ以上の遺伝子を選択することを含む。実施形態において、第1および第2の表からの遺伝子の選択は、第2の表にはない第1の表の1つ以上の遺伝子と、第1の表にはない第2の表の1つ以上の遺伝子とを選択することを含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。 In embodiments, the cancer is breast cancer and the plurality of target cfRNA molecules detected above the threshold is one or more of Tables 3, 4, 6 and 13 (e.g., 2, 3, 5, or more genes) transcripts. In embodiments, the one or more target cfRNA molecules are one or more genes (e.g., 2, 3, 5, or more genes) selected from each of Tables 3, 4, 6 and 13 derived from In embodiments, selecting genes from the first and second tables comprises selecting one or more genes in both the first and second tables. In embodiments, the selection of genes from the first and second tables includes one or more genes from the first table that are not in the second table and one gene from the second table that is not in the first table. Selecting one or more genes. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes).

実施形態において、1つ以上の標的cfRNA分子は、(a)表5および表6から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)、および/または(b)表7から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)と組み合わせた、表11から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)に由来する。実施形態において、第1および第2の表からの遺伝子の選択は、第1および第2の表の両方で1つ以上の遺伝子を選択することを含む。実施形態において、第1および第2の表からの遺伝子の選択は、第2の表にはない第1の表の1つ以上の遺伝子と、第1の表にはない第2の表の1つ以上の遺伝子とを選択することを含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。 In embodiments, the one or more target cfRNA molecules are (a) one or more genes selected from Tables 5 and 6 (e.g., 2, 3, 5, or more genes), and or (b) one or more genes selected from Table 11 in combination with one or more genes selected from Table 7 (e.g., 2, 3, 5, or more genes) for example, 2, 3, 5, or more genes). In embodiments, selecting genes from the first and second tables comprises selecting one or more genes in both the first and second tables. In embodiments, the selection of genes from the first and second tables includes one or more genes from the first table that are not in the second table and one gene from the second table that is not in the first table. Selecting one or more genes. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes).

実施形態において、1つ以上の標的cfRNA分子は、(a)表5から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)、および/または(b)表7から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)と組み合わせた、表12から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)に由来する。実施形態において、第1および第2の表からの遺伝子の選択は、第1および第2の表の両方で1つ以上の遺伝子を選択することを含む。実施形態において、第1および第2の表からの遺伝子の選択は、第2の表にはない第1の表の1つ以上の遺伝子と、第1の表にはない第2の表の1つ以上の遺伝子とを選択することを含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。 In embodiments, the one or more target cfRNA molecules are (a) one or more genes selected from Table 5 (e.g., 2, 3, 5, or more genes), and/or ( b) one or more genes selected from Table 12 (e.g. 2) in combination with one or more genes selected from Table 7 (e.g. 2, 3, 5 or more genes) 1, 3, 5 or more genes). In embodiments, selecting genes from the first and second tables comprises selecting one or more genes in both the first and second tables. In embodiments, the selection of genes from the first and second tables includes one or more genes from the first table that are not in the second table and one gene from the second table that is not in the first table. Selecting one or more genes. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes).

実施形態において、1つ以上の標的cfRNA分子は、(a)表4から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)、(b)表6から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)、および/または(c)表7から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)と組み合わせた、表13から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)に由来する。実施形態において、第1および第2の表からの遺伝子の選択は、第1および第2の表の両方で1つ以上の遺伝子を選択することを含む。実施形態において、第1および第2の表からの遺伝子の選択は、第2の表にはない第1の表の1つ以上の遺伝子と、第1の表にはない第2の表の1つ以上の遺伝子とを選択することを含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。 In embodiments, the one or more target cfRNA molecules are (a) one or more genes selected from Table 4 (e.g., 2, 3, 5, or more genes), (b) 6 (e.g., 2, 3, 5, or more genes); and/or (c) one or more genes selected from Table 7 (e.g., 2 from one or more genes selected from Table 13 (e.g., 2, 3, 5, or more genes) in combination with 1, 3, 5, or more genes) . In embodiments, selecting genes from the first and second tables comprises selecting one or more genes in both the first and second tables. In embodiments, the selection of genes from the first and second tables includes one or more genes from the first table that are not in the second table and one gene from the second table that is not in the first table. Selecting one or more genes. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes).

実施形態において、1つ以上の標的cfRNA分子は、(a)表3から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)、(b)表6から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)、および/または(c)表7から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)と組み合わせた、表4から選択される1つ以上の遺伝子(例えば、2つ、3つ、5つ、またはそれ以上の遺伝子)に由来する。実施形態において、第1および第2の表からの遺伝子の選択は、第1および第2の表の両方で1つ以上の遺伝子を選択することを含む。実施形態において、第1および第2の表からの遺伝子の選択は、第2の表にはない第1の表の1つ以上の遺伝子と、第1の表にはない第2の表の1つ以上の遺伝子とを選択することを含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。 In embodiments, the one or more target cfRNA molecules are (a) one or more genes selected from Table 3 (e.g., 2, 3, 5, or more genes), (b) 6 (e.g., 2, 3, 5, or more genes); and/or (c) one or more genes selected from Table 7 (e.g., 2 from one or more genes selected from Table 4 (e.g., 2, 3, 5, or more genes) in combination with 1, 3, 5, or more genes) . In embodiments, selecting genes from the first and second tables comprises selecting one or more genes in both the first and second tables. In embodiments, the selection of genes from the first and second tables includes one or more genes from the first table that are not in the second table and one gene from the second table that is not in the first table. Selecting one or more genes. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes).

いくつかの実施形態において、1つ以上の標的cfRNA分子は、表8に列挙された遺伝子から選択される1つ以上の遺伝子に由来する。実施形態において、1つ以上の標的cfRNA分子は、表8の少なくとも2、3、4、5、10、15、20または30個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表8の少なくとも5つの遺伝子(例えば、最初の5つの遺伝子CEACAM5、RHOV、SFTA2、SCGB1D2、およびIGF2BP1)を含む。実施形態において、1つ以上の標的cfRNA分子は、表8の少なくとも10個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表8の少なくとも25個の遺伝子を含む。実施形態において、1つ以上の標的cfRNA分子は、表8のすべての遺伝子を含む。実施形態において、測定される標的cfRNA分子は、500個未満の遺伝子(例えば、400、300、200、100または50個未満の遺伝子)に由来する。実施形態において、閾値を超えて検出された複数の標的cfRNA分子は、CEACAM5、RHOV、SFTA2、SCGB1D2、IGF2BP1、SFTPA1、CA12、SFTPB、CDH3、MUC6、SLC6A14、HOXC9、AGR3、TMEM125、TFAP2B、IRX2、POTEKP、ARHGEF38、GPR87、LMX1B、ATP10B、NELL1、MUC21、SOX9、LINC00993、STMND1、ERVH48-1、SCTR、MAGEA3、MB、LEMD1、SIX4およびNXNL2からなる群から選択される複数の遺伝子に由来するcfRNA分子である。以下の表8は、非常に有益な癌バイオマーカーの例を提供する。 In some embodiments, one or more target cfRNA molecules are derived from one or more genes selected from the genes listed in Table 8. In embodiments, the one or more target cfRNA molecules comprise at least 2, 3, 4, 5, 10, 15, 20 or 30 genes of Table 8. In embodiments, the one or more target cfRNA molecules comprise at least five genes of Table 8 (eg, the first five genes CEACAM5, RHOV, SFTA2, SCGB1D2, and IGF2BP1). In embodiments, the one or more target cfRNA molecules comprise at least 10 genes of Table 8. In embodiments, the one or more target cfRNA molecules comprise at least 25 genes of Table 8. In embodiments, the one or more target cfRNA molecules comprise all genes in Table 8. In embodiments, the target cfRNA molecules that are measured are derived from less than 500 genes (eg, less than 400, 300, 200, 100 or 50 genes). In embodiments, the plurality of target cfRNA molecules detected above the threshold are CEACAM5, RHOV, SFTA2, SCGB1D2, IGF2BP1, SFTPA1, CA12, SFTPB, CDH3, MUC6, SLC6A14, HOXC9, AGR3, TMEM125, TFAP2B, IRX2, cfRNA molecules derived from a plurality of genes selected from the group consisting of POTEKP, ARHGEF38, GPR87, LMX1B, ATP10B, NELL1, MUC21, SOX9, LINC00993, STMND1, ERVH48-1, SCTR, MAGEA3, MB, LEMD1, SIX4 and NXNL2 is. Table 8 below provides examples of highly informative cancer biomarkers.

Figure 2021257729000015
Figure 2021257729000015

実施形態において、閾値レベルを超える標的cfRNA分子の1つ以上を検出することは、(i)検出、(ii)バックグラウンドを超える検出、または(iii)状態を有さない対象における標的cfRNA分子のレベルよりも高いレベルでの検出を含む。実施形態において、閾値を超える検出は、検出を含む。実施形態において、閾値を超える検出は、バックグラウンドを超える検出を含む。実施形態において、閾値を超える検出は、その状態を有さない対象における標的cfRNA分子のレベルよりも高いレベルでの検出を含む。 In embodiments, detecting one or more of the target cfRNA molecules above a threshold level is (i) detection, (ii) detection above background, or (iii) detection of target cfRNA molecules in a subject without the condition. Includes detections at higher levels. In embodiments, detection above a threshold comprises detection. In embodiments, detection above a threshold includes detection above background. In embodiments, detection above a threshold comprises detection at a level that is higher than the level of target cfRNA molecules in a subject that does not have the condition.

実施形態において、閾値レベルを超える標的cfRNA分子の1つ以上を検出することは、状態を有さない対象におけるレベルよりも少なくとも約または正確に10倍高い(例えば、15、20、50、100、またはそれ以上高い)レベルで、1つ以上の標的cfRNA分子を検出することを含む。実施形態において、閾値レベルを超える検出は、状態を有さない対象におけるレベルよりも少なくとも約または正確に25倍高いレベルで、1つ以上の標的cfRNA分子を検出することを含む。実施形態において、閾値レベルを超える検出は、状態を有さない対象におけるレベルよりも少なくとも約または正確に50倍高いレベルで、1つ以上の標的cfRNA分子を検出することを含む。 In embodiments, detecting one or more of the target cfRNA molecules above a threshold level is at least about or exactly 10-fold higher than levels in subjects without the condition (e.g., 15, 20, 50, 100, detecting one or more target cfRNA molecules at a level that is greater than or equal to cfRNA. In embodiments, detecting above a threshold level comprises detecting one or more target cfRNA molecules at levels that are at least about or exactly 25-fold higher than levels in subjects without the condition. In embodiments, detecting above a threshold level comprises detecting one or more target cfRNA molecules at levels that are at least about or exactly 50-fold higher than levels in subjects without the condition.

実施形態において、閾値レベルを超える標的cfRNA分子の1つ以上を検出することは、0.5~5リード・パー・ミリオン(reads per million(RPM))、例えば、約もしくは正確に1、1.5、2、2.5、3、3.5、4、または約もしくは正確に4.5RPMの閾値を超える検出を含む。実施形態において、閾値を超える検出は、1RPMを超える検出を含む。実施形態において、閾値を超える検出は、1RPMを超える検出を含む。実施形態において、閾値を超える検出は、2RPMを超える検出を含む。実施形態において、閾値を超える検出は、5RPMを超える検出を含む。 In embodiments, detecting one or more of the target cfRNA molecules above the threshold level is 0.5 to 5 reads per million (RPM), eg, about or exactly 1, 1 . Includes detection above a threshold of 5, 2, 2.5, 3, 3.5, 4, or about or exactly 4.5 RPM. In embodiments, detecting above the threshold includes detecting above 1 RPM. In embodiments, detecting above the threshold includes detecting above 1 RPM. In embodiments, detecting above the threshold includes detecting above 2 RPM. In embodiments, detecting above the threshold includes detecting above 5 RPM.

疾患および障害
本開示の実施形態に従う方法は、心血管疾患、肝臓疾患、または癌を含むがこれらに限定されない、さまざまな疾患または状態のいずれかの存在または非存在を検出するために使用することができる。いくつかの実施形態において、前記方法は癌ステージを決定することを含む。いくつかの実施形態において、癌ステージは、ステージI癌、ステージII癌、ステージIII癌、またはステージIV癌である。
Diseases and Disorders Methods according to embodiments of the present disclosure can be used to detect the presence or absence of any of a variety of diseases or conditions, including but not limited to cardiovascular disease, liver disease, or cancer. can be done. In some embodiments, the method comprises determining cancer stage. In some embodiments, the cancer stage is stage I cancer, stage II cancer, stage III cancer, or stage IV cancer.

いくつかの実施形態において、前記方法は、癌、肉腫、骨髄腫、白血病、リンパ腫、芽細胞腫、胚細胞腫瘍、またはそれらの任意の組み合わせの存在または非存在の検出、ステージの決定、進行の監視、および/または分類を含む。いくつかの実施形態において、癌腫は腺癌であり得る。他の実施形態において、癌腫は扁平上皮癌であり得る。さらに他の実施形態において、癌腫は、小細胞肺癌、非小細胞肺癌、上咽頭癌、結腸直腸癌、肛門癌、肝臓癌、膀胱癌、子宮頸癌、精巣癌、卵巣癌、胃癌、食道癌、頭頸部癌、膵臓癌、前立腺癌、腎臓癌、甲状腺癌、メラノーマおよび乳癌からなる群から選択される。いくつかの実施形態において、乳癌は、ホルモン受容体陰性乳癌またはトリプルネガティブ乳癌である。 In some embodiments, the method comprises detecting the presence or absence of, staging, progression of cancer, sarcoma, myeloma, leukemia, lymphoma, blastoma, germ cell tumor, or any combination thereof. including monitoring and/or classification. In some embodiments, the carcinoma can be an adenocarcinoma. In other embodiments, the carcinoma can be squamous cell carcinoma. In still other embodiments, the carcinoma is small cell lung cancer, non-small cell lung cancer, nasopharyngeal cancer, colorectal cancer, anal cancer, liver cancer, bladder cancer, cervical cancer, testicular cancer, ovarian cancer, gastric cancer, esophageal cancer , head and neck cancer, pancreatic cancer, prostate cancer, renal cancer, thyroid cancer, melanoma and breast cancer. In some embodiments, the breast cancer is hormone receptor negative breast cancer or triple negative breast cancer.

いくつかの実施形態において、前記方法は、肉腫の存在または非存在の検出、ステージの決定、進行の監視、および/または分類を含む。いくつかの実施形態において、肉腫は、骨肉腫、軟骨肉腫、平滑筋肉腫、横紋筋肉腫、中皮肉腫(中皮腫)、線維肉腫、血管肉腫、脂肪肉腫、神経膠腫および星細胞腫からなる群から選択され得る。さらに他の実施形態において、前記方法は、白血病の存在または非存在の検出、ステージの決定、進行の監視、および/または分類を含む。さまざまな実施形態において、白血病は、骨髄性白血病、顆粒球性白血病、リンパ性白血病、リンパ球性白血病およびリンパ芽球性白血病からなる群から選択され得る。さらに他の実施形態において、前記方法は、リンパ腫の存在または非存在の検出、ステージの決定、進行の監視、および/または分類を含む。さまざまな実施形態において、リンパ腫は、ホジキンリンパ腫および非ホジキンリンパ腫からなる群から選択され得る。 In some embodiments, the method comprises detecting the presence or absence of sarcoma, determining staging, monitoring progression, and/or classification. In some embodiments, the sarcoma is osteosarcoma, chondrosarcoma, leiomyosarcoma, rhabdomyosarcoma, mesothelioma (mesothelioma), fibrosarcoma, angiosarcoma, liposarcoma, glioma and astrocytoma can be selected from the group consisting of In still other embodiments, the method comprises detecting the presence or absence of leukemia, determining the stage, monitoring progression, and/or classifying. In various embodiments, the leukemia can be selected from the group consisting of myeloid leukemia, granulocytic leukemia, lymphocytic leukemia, lymphocytic leukemia and lymphoblastic leukemia. In yet other embodiments, the method comprises detecting the presence or absence of lymphoma, determining staging, monitoring progression, and/or classification. In various embodiments, the lymphoma can be selected from the group consisting of Hodgkin's lymphoma and non-Hodgkin's lymphoma.

本開示の態様は、疾患の起源組織を決定する方法であって、前記起源組織が、膵臓組織、肝胆道組織、肝組織、肺組織、脳組織、神経内分泌組織、子宮組織、腎組織、尿路上皮組織、腎組織、子宮頸部組織、***組織、脂肪、結腸組織、直腸組織、心臓組織、骨格筋組織、前立腺組織および甲状腺組織からなる群から選択される、方法を含む。 An aspect of the present disclosure is a method of determining the tissue of origin of a disease, wherein the tissue of origin is pancreatic tissue, hepatobiliary tissue, liver tissue, lung tissue, brain tissue, neuroendocrine tissue, uterine tissue, kidney tissue, urine tissue. The method comprises a method selected from the group consisting of tract epithelial tissue, kidney tissue, cervical tissue, breast tissue, adipose, colon tissue, rectal tissue, heart tissue, skeletal muscle tissue, prostate tissue and thyroid tissue.

本開示の態様は、癌細胞型を決定する方法であって、前記癌細胞型が、膀胱癌、乳癌、子宮頸癌、結腸直腸癌、子宮内膜癌、食道癌、胃癌、頭頸部癌、肝胆道癌、血液癌、肝臓癌、肺癌、リンパ腫、メラノーマ、多発性骨髄腫、卵巣癌、膵臓癌、前立腺癌、腎臓癌、甲状腺癌、尿道癌および子宮癌からなる群から選択される、方法を含む。 An aspect of the present disclosure is a method of determining a cancer cell type, wherein the cancer cell type is bladder cancer, breast cancer, cervical cancer, colorectal cancer, endometrial cancer, esophageal cancer, gastric cancer, head and neck cancer, A method selected from the group consisting of hepatobiliary cancer, blood cancer, liver cancer, lung cancer, lymphoma, melanoma, multiple myeloma, ovarian cancer, pancreatic cancer, prostate cancer, renal cancer, thyroid cancer, urethral cancer and uterine cancer. including.

処置条件
本明細書に開示される方法は、治療上の決定、指導および監視、ならびに癌治療の開発および臨床試験を行う際に使用することができる。例えば、治療効果は、分子標的療法(モノクローナル薬)、化学療法薬、放射線プロトコールなど、またはこれらの組み合わせなどの特定の治療法による処置前、処置中、および処置後のサンプル中の患者のcfRNAを比較することによってモニタリングできる。いくつかの実施形態において、cfRNAは、特定の癌バイオマーカーが処置後に増加するか減少するかを確認するためにモニタリングされ、これにより、医師は、従来の患者の症状を追跡するモニタリング方法よりもはるかに短い期間で処置を変更(例えば、処置の継続、中止または変更)することができる。いくつかの実施形態において、本方法は、検出されたcfRNAバイオマーカーに関連する癌の特定のステージまたは種類を有する対象を診断する、あるいは患者がそのような癌を有するまたは発症する可能性を報告するなど、RNA由来の配列に基づいて対象を診断するステップをさらに含む。実施形態において、本明細書に開示される方法は、検出された状態に基づいて処置を選択することをさらに含む。実施形態において、選択された処置が対象に投与される。状態が癌、または特定の癌の種類および/もしくはステージである場合、適切な抗癌療法が選択され得る。抗癌療法の非限定的な例としては、放射線療法、外科的切除、抗癌剤(例えば、免疫療法剤、化学療法剤など)の投与、またはこれらの1つ以上の組み合わせが挙げられる。
Treatment Conditions The methods disclosed herein can be used in making therapeutic decisions, guidance and monitoring, as well as cancer therapy development and clinical trials. For example, therapeutic efficacy may be measured by treating a patient's cfRNA in samples before, during, and after treatment with a particular therapy, such as a targeted therapy (monoclonal drug), a chemotherapeutic drug, a radiation protocol, etc., or a combination thereof. can be monitored by comparison. In some embodiments, the cfRNA is monitored to see if a particular cancer biomarker increases or decreases after treatment, allowing physicians to use more than traditional monitoring methods to track patient symptoms. Treatment can be changed (eg, continued, stopped, or changed) over a much shorter period of time. In some embodiments, the method diagnoses a subject with a particular stage or type of cancer associated with a detected cfRNA biomarker, or reports a patient's likelihood of having or developing such cancer. Further comprising diagnosing the subject based on the RNA-derived sequence, such as. In embodiments, the methods disclosed herein further comprise selecting treatment based on the detected condition. In embodiments, the selected treatment is administered to the subject. If the condition is cancer, or a particular cancer type and/or stage, an appropriate anti-cancer therapy may be selected. Non-limiting examples of anti-cancer therapies include radiation therapy, surgical resection, administration of anti-cancer agents (eg, immunotherapeutic agents, chemotherapeutic agents, etc.), or combinations of one or more thereof.

分類モデル
本開示の態様は、分類モデルに関する。例えば、機械学習または深層学習モデル(例えば、疾患分類器)を使用して、1つ以上のRNA分子または配列リード(1つ以上のcfRNA分子に由来する)から決定された1つ以上の特徴の値に基づいて疾患状態を決定することができる。さまざまな実施形態において、機械学習または深層学習モデルの出力は、疾患状態の予測スコアまたは確率(例えば、予測癌スコア)である。したがって、機械学習または深層学習モデルは、予測スコアまたは確率に基づいて疾患状態の分類を生成する。
Classification Model Aspects of this disclosure relate to classification models. For example, one or more features determined from one or more RNA molecules or sequence reads (derived from one or more cfRNA molecules) using machine learning or deep learning models (e.g., disease classifiers). A disease state can be determined based on the values. In various embodiments, the output of the machine learning or deep learning model is a predicted score or probability of disease state (eg, predicted cancer score). Thus, machine learning or deep learning models generate disease state classifications based on predictive scores or probabilities.

いくつかの実施形態において、機械学習モデルはロジスティック回帰を含む。他の実施形態において、機械学習または深層学習モデルは、決定木、アンサンブル(例えば、バギング、ブースティング、ランダムフォレスト)、勾配ブースティングマシン、ion、ナイーブベイズ、サポートベクターマシン、またはニューラルネットワークのうちの1つであり得る。疾患状態モデルは、訓練中に調整される特徴に対する学習された重み(learned weights)を含む。本明細書において重みという用語は、使用される特定の機械学習技術に関係なく、モデルの任意の特徴に関連付けられた学習量を表すために一般的に使用される。いくつかの実施形態において、癌指標スコアは、1つ以上のRNA配列(またはそのDNA配列リード)に由来する特徴の値を機械学習または深層学習モデルに入力することによって決定される。 In some embodiments, the machine learning model comprises logistic regression. In other embodiments, the machine learning or deep learning model is one of decision trees, ensembles (e.g., bagging, boosting, random forests), gradient boosting machines, ion, naive Bayes, support vector machines, or neural networks. can be one. A disease state model includes learned weights for features that are adjusted during training. The term weight is used generically herein to denote the amount of learning associated with any feature of the model, regardless of the particular machine learning technique used. In some embodiments, a cancer index score is determined by inputting feature values derived from one or more RNA sequences (or DNA sequence reads thereof) into a machine learning or deep learning model.

訓練中に、訓練データが処理されて、疾患状態モデルの重みを訓練するために使用される特徴の値が生成される。一例として、訓練データは、訓練サンプルから得られたcfRNAデータおよび/またはWBC RNAデータ、ならびに出力ラベルを含み得る。例えば、出力ラベルは、個人が特定の疾患を有することが知られている(例えば、癌を有することが知られている)か、健康であることが知られている(すなわち、疾患がない)かを示すものであり得る。他の実施形態において、疾患の種類、または起源組織(例えば、癌の起源組織)、または疾患の重症度の指標(例えば、癌のステージ)を決定し、それに対する出力ラベルを生成するために、モデルが使用され得る。実施形態によっては、疾患状態モデルは、cfRNA分子またはそれに由来する配列の検出および定量化に使用されるRNAアッセイから決定される特徴の1つ以上についての値、および訓練されるモデルに関連する計算分析を受け取る。一実施形態において、1つ以上の特徴は、1つ以上のcfRNA分子またはそれに由来する配列リードの量を含む。訓練中のモデルによって出力されたスコアと訓練データの出力ラベルとの間の差異に応じて、予測癌モデルの重みは、疾患状態モデルがより正確な予測を行うことができるように最適化される。さまざまな実施形態において、疾患状態モデルはノンパラメトリックモデル(例えば、k近傍法)であってもよく、したがって、予測癌モデルは、パラメータを最適化することなく、より正確に予測を行うように訓練され得る。 During training, the training data is processed to generate feature values that are used to train the weights of the disease state model. By way of example, training data may include cfRNA data and/or WBC RNA data obtained from training samples, and output labels. For example, the output label could be that the individual is known to have a particular disease (e.g. known to have cancer) or is known to be healthy (i.e. no disease). It can indicate whether In other embodiments, to determine the type of disease, or tissue of origin (e.g., tissue of origin for cancer), or an indication of disease severity (e.g., stage of cancer), and generate an output label for it, model can be used. In some embodiments, the disease state model includes values for one or more of the features determined from RNA assays used to detect and quantify cfRNA molecules or sequences derived therefrom, and calculations associated with the model being trained. Receive analytics. In one embodiment, the one or more features comprise the amount of one or more cfRNA molecules or sequence reads derived therefrom. Depending on the difference between the scores output by the model during training and the output labels of the training data, the weights of the predictive cancer model are optimized so that the disease state model can make more accurate predictions. . In various embodiments, the disease state model may be a non-parametric model (e.g., k nearest neighbors), thus predictive cancer models are trained to make more accurate predictions without parameter optimization. can be

訓練された疾患状態モデルは、コンピュータ可読媒体に保存され、その後、必要なときに、例えばモデルの展開中に読み出されることができる。 The trained disease state model can be stored on a computer readable medium and then retrieved when needed, eg, during model deployment.

いくつかの実施形態において、前記方法は、遺伝子発現行列(G)に組織特異性行列(TS)を乗算することによって、遺伝子発現行列(G)を組織スコア行列(S)に変換することを含む。Gm,nは、サンプルmにおける遺伝子nの発現レベルである。TSn,jは、組織jに対する遺伝子nの組織特異性である。遺伝子nが組織jに特異的でない場合、TSn,j=0である。いくつかの実施形態において、組織特異性行列は、組織RNA-seqデータベース(GTEx)を使用して計算される。組織スコアは、例えば癌サンプルと非癌サンプルを分類するためのモデルを構築するための特徴として使用され得る。非限定的な一実施形態において、肺癌を非癌cfRNAサンプルから区別する決定木分類器を構築するために、肺癌サンプルから同定されたダークチャネル遺伝子(SFTPA2、SLC39A4、NKX2_1、SFTPA1、BPIFA1、SLC34A2、CXCL17、SFTA3、MUC1、AGR2、WFDC2、ABCA12、VSIG10、CRABP2)が使用された。この分析の結果を図10に示す。 In some embodiments, the method comprises converting the gene expression matrix (G) to a tissue score matrix (S) by multiplying the gene expression matrix (G) by a tissue specificity matrix (TS). . Gm,n is the expression level of gene n in sample m. TSn,j is the tissue specificity of gene n for tissue j. If gene n is not specific to tissue j, then TSn,j=0. In some embodiments, tissue-specific matrices are calculated using the tissue RNA-seq database (GTEx). Tissue scores can be used, for example, as features to build models for classifying cancerous and non-cancer samples. In one non-limiting embodiment, dark channel genes identified from lung cancer samples (SFTPA2, SLC39A4, NKX2_1, SFTPA1, BPIFA1, SLC34A2, CXCL17, SFTA3, MUC1, AGR2, WFDC2, ABCA12, VSIG10, CRABP2) were used. The results of this analysis are shown in FIG.

シーケンシングとバイオインフォマティクス
本開示の態様は、複数の配列リードを生成するための核酸分子のシーケンシング、および主題の方法を実行するための配列リードのバイオインフォマティクス操作を含む。
Sequencing and Bioinformatics Aspects of the present disclosure include sequencing of nucleic acid molecules to generate a plurality of sequence reads, and bioinformatics manipulation of the sequence reads to perform the subject methods.

さまざまな実施形態において、サンプルは対象から採取され、その後、目的の遺伝子領域または遺伝子断片について濃縮される。例えば、いくつかの実施形態において、サンプルは、癌関連遺伝子または目的の遺伝子断片を含むヌクレオチドアレイへのハイブリダイゼーションによって濃縮することができる。いくつかの実施形態において、サンプルは、ハイブリッド捕捉などの当技術分野で知られている他の方法を使用して、目的の遺伝子(例えば、癌関連遺伝子)について濃縮することができる。例えば、Lapidus(米国特許第7,666,593号)を参照(その内容は参照によりその全体が本明細書に組み込まれる)。あるハイブリッド捕捉法では、ビオチン化オリゴヌクレオチドおよびストレプトアビジンでコーティングされた磁気ビーズの使用を含む、溶液ベースのハイブリダイゼーション法が使用される。例えば、Duncavage et al., J Mol Diagn.13(3):325-333頁(2011年);およびNewman et al., Nat Med.20(5):548-554頁(2014年)を参照。本開示の方法によるサンプルからの核酸の単離は、当技術分野で知られている任意の方法に従って行うことができる。 In various embodiments, a sample is taken from a subject and then enriched for a gene region or gene fragment of interest. For example, in some embodiments, samples can be enriched by hybridization to nucleotide arrays containing cancer-associated genes or gene fragments of interest. In some embodiments, samples can be enriched for genes of interest (eg, cancer-associated genes) using other methods known in the art, such as hybrid capture. See, eg, Lapidus (US Pat. No. 7,666,593), the contents of which are hereby incorporated by reference in their entirety. One hybrid capture method uses a solution-based hybridization method that involves the use of biotinylated oligonucleotides and streptavidin-coated magnetic beads. For example, Duncavage et al. , J Mol Diagn. 13(3):325-333 (2011); and Newman et al. , Nat Med. 20(5):548-554 (2014). Isolation of nucleic acids from a sample by the methods of the present disclosure can be performed according to any method known in the art.

シーケンシングは、当技術分野で既知の任意の方法または方法の組み合わせによって行うことができる。例えば、既知の核酸シーケンシング技術としては、限定されるものではないが、標識ターミネータまたはプライマーを用いた古典的なジデオキシシーケンシング反応(サンガー法)とスラブまたはキャピラリーでのゲル分離、可逆的に終結した標識ヌクレオチドを用いた合成によるシーケンシング、パイロシーケンシング、454シーケンシング、標識オリゴヌクレオチドプローブのライブラリへの対立遺伝子特異的ハイブリダイゼーション、標識クローンのライブラリへの対立遺伝子特異的ハイブリダイゼーションを用いた合成とそれに続くライゲーションによるシーケンシング、重合ステップ中の標識ヌクレオチドの組み込みのリアルタイムモニタリング、Polonyシーケンシング、およびSOLiDシーケンシングが挙げられる。分離された分子のシーケンシングは、最近になって、ポリメラーゼまたはリガーゼを使用した連続的または単一の伸長反応、およびプローブのライブラリとの単一または連続的なディファレンシャルハイブリダイゼーションによって実証されている。 Sequencing can be performed by any method or combination of methods known in the art. For example, known nucleic acid sequencing techniques include, but are not limited to, classical dideoxy sequencing reactions (Sanger method) with labeled terminators or primers and gel separation in slabs or capillaries, reversibly terminated Pyrosequencing, 454 sequencing, allele-specific hybridization of labeled oligonucleotide probes to libraries, synthesis using allele-specific hybridization of labeled clones to libraries and subsequent sequencing by ligation, real-time monitoring of incorporation of labeled nucleotides during the polymerization step, Polony sequencing, and SOLiD sequencing. Sequencing of separated molecules has recently been demonstrated by sequential or single extension reactions using polymerases or ligases and single or sequential differential hybridizations with libraries of probes.

シーケンシングを実行する従来の方法の1つは、Sanger et al.,Proc.Natl.Acad.Sci.USA,74(12):5463 67頁(1977年)によって説明されているように、鎖の停止とゲル分離によるものであり、その内容は参照によりその全体が本明細書に組み込まれる。別の従来のシーケンシング方法には、核酸断片の化学的分解が含まれる。Maxam et al.,Proc.Natl.Acad.Sci., 74:560 564頁(1977年)を参照(その内容は参照によりその全体が本明細書に組み込まれる)。ハイブリダイゼーションによるシーケンシングに基づいた方法も開発されている。例えば、Harris et al.(米国特許出願番号2009/0156412)を参照(その内容は参照によりその全体が本明細書に組み込まれる)。 One conventional method of performing sequencing is that of Sanger et al. , Proc. Natl. Acad. Sci. USA, 74(12):5463 67 (1977), the contents of which are incorporated herein by reference in their entirety. Another conventional sequencing method involves chemical degradation of nucleic acid fragments. Maxam et al. , Proc. Natl. Acad. Sci. , 74:560 564 (1977), the contents of which are incorporated herein by reference in their entirety. Methods based on sequencing by hybridization have also been developed. For example, Harris et al. (US Patent Application No. 2009/0156412), the contents of which are incorporated herein by reference in their entirety.

本開示の方法において使用され得るシーケンシング技術には、例えば、Helicos True Single Molecule Sequencing(tSMS)が含まれる(Harris T. D. et al.(2008年)Science 320:106-109頁、その内容は参照によりその全体が本明細書に組み込まれる)。tSMSのさらなる説明は、例えば、Lapidus et al.(米国特許第7,169,560号、その内容は参照によりその全体が本明細書に組み込まれる)、Lapidus et al.(米国特許出願公開第2009/0191565号、その内容は参照によりその全体が本明細書に組み込まれる)、Quake et al.(米国特許第6,818,395号、その内容は参照によりその全体が本明細書に組み込まれる)、Harris米国特許第7,282,337号、その内容は参照によりその全体が本明細書に組み込まれる)、Quake et al.(米国特許出願公開第2002/0164629号、その内容は参照によりその全体が本明細書に組み込まれる)、およびBraslavsky, et al.,PNAS(USA),100:3960-3964頁(2003年)(その内容は参照によりその全体が本明細書に組み込まれる)に示されている。 Sequencing techniques that can be used in the methods of the present disclosure include, for example, Helicos True Single Molecule Sequencing (tSMS) (Harris T. D. et al. (2008) Science 320:106-109, the contents of which is incorporated herein by reference in its entirety). Further description of tSMS can be found, for example, in Lapidus et al. (U.S. Pat. No. 7,169,560, the contents of which are incorporated herein by reference in their entirety), Lapidus et al. (U.S. Patent Application Publication No. 2009/0191565, the contents of which are incorporated herein by reference in their entirety), Quake et al. (U.S. Pat. No. 6,818,395, the contents of which are incorporated herein by reference in their entirety), Harris U.S. Pat. No. 7,282,337, the contents of which are incorporated herein by reference in their entirety. incorporated), Quake et al. (U.S. Patent Application Publication No. 2002/0164629, the contents of which are incorporated herein by reference in their entirety), and Braslavsky, et al. , PNAS (USA), 100:3960-3964 (2003), the contents of which are incorporated herein by reference in their entirety.

本開示の方法において使用され得る核酸シーケンシング技術の別の例は、454シーケンシング(Roche社)である(Margulies, M et al.2005年,Nature,437,376-380頁、その内容は参照によりその全体が本明細書に組み込まれる)。本開示の方法において使用され得るDNAシーケンシング技術の別の例は、SOLiD技術である(Applied Biosystems社)。本開示の方法において使用され得るDNAシーケンシング技術の別の例は、Ion Torrentシーケンシングである(米国特許出願公開第2009/0026082号、第2009/0127589号、第2010/0035252号、第2010/0137143号、第2010/0188073号、第2010/0197507号、第2010/0282617号、第2010/0300559号、第2010/0300895号、第2010/0301398号、および第2010/0304982号、それぞれの内容は参照によりその全体が本明細書に組み込まれる)。 Another example of a nucleic acid sequencing technology that can be used in the disclosed methods is 454 sequencing (Roche) (Margulies, M et al. 2005, Nature, 437, 376-380, see is incorporated herein in its entirety by). Another example of a DNA sequencing technology that can be used in the disclosed methods is SOLiD technology (Applied Biosystems). Another example of a DNA sequencing technique that can be used in the methods of the present disclosure is Ion Torrent sequencing (U.S. Patent Application Publication Nos. 2009/0026082, 2009/0127589, 2010/0035252, 2010/ 0137143, 2010/0188073, 2010/0197507, 2010/0282617, 2010/0300559, 2010/0300895, 2010/0301398, and 2010/0304982, each of which contains incorporated herein by reference in its entirety).

いくつかの実施形態において、シーケンシング技術はIlluminaシーケンシングである。Illuminaシーケンシングは、フォールドバックPCRとアンカープライマーを使用した固体表面上のDNA増幅に基づいている。ゲノムDNAは断片化することができるが、cfDNAの場合はすでに短い断片であるため断片化は必要ない。アダプターは断片の5’末端および3’末端にライゲーションされる。フローセルチャネルの表面に付着したDNA断片は伸長され、ブリッジ増幅される。断片は二本鎖になり、二本鎖分子は変性する。固相増幅とそれに続く変性を複数サイクル行うと、フローセルの各チャネル内に同じテンプレートの一本鎖DNA分子の約1,000コピーからなる数百万個のクラスターが作成される。プライマー、DNAポリメラーゼ、および4種類の蛍光色素で標識された可逆的終結ヌクレオチドを使用して、連続シーケンシングを実行する。ヌクレオチドの組み込み後、レーザーで蛍光色素を励起し、画像を撮影して最初の塩基のアイデンティティを記録する。組み込まれた各塩基から3’ターミネータと蛍光色素が除去され、組み込み、検出、および同定のステップが繰り返される。 In some embodiments, the sequencing technology is Illumina sequencing. Illumina sequencing is based on DNA amplification on a solid surface using foldback PCR and anchored primers. Genomic DNA can be fragmented, but fragmentation is not necessary in the case of cfDNA, since they are already short fragments. Adapters are ligated to the 5' and 3' ends of the fragments. DNA fragments attached to the surface of the flow cell channel are elongated and bridge amplified. The fragment becomes double stranded and the double stranded molecule is denatured. Multiple cycles of solid-phase amplification followed by denaturation create millions of clusters of approximately 1,000 copies of the same template single-stranded DNA molecule within each channel of the flow cell. Sequential sequencing is performed using primers, DNA polymerase, and reversible terminating nucleotides labeled with four fluorescent dyes. After incorporation of the nucleotide, a laser excites the fluorescent dye and an image is taken to record the identity of the first base. The 3' terminator and fluorescent dye are removed from each incorporated base, and the steps of incorporation, detection, and identification are repeated.

本開示の方法において使用され得るシーケンシング技術の別の例には、Pacific Biosciences社の単一分子リアルタイム(SMRT)技術が含まれる。本開示の方法において使用され得るシーケンシング技術のさらに別の例は、ナノポアシーケンシングである(Soni G VおよびMeller A.(2007年)Clin Chem 53:1996-2001頁、その内容は参照によりその全体が本明細書に組み込まれる)。本開示の方法において使用され得るシーケンシング技術の別の例には、化学感受性電界効果トランジスタ(chemFET)アレイを使用してDNAをシーケンシングすることが含まれる(例えば、米国特許出願公開第20090026082号、その内容は参照によりその全体が本明細書に組み込まれる)。本開示の方法において使用され得るシーケンシング技術の別の例には、電子顕微鏡の使用が含まれる(Moudrianakis E. N.およびBeer M. Proc Natl Acad Sci USA.1965年3月;53:564-71頁、その内容は参照によりその全体が本明細書に組み込まれる)。 Another example of a sequencing technology that can be used in the methods of the present disclosure includes Pacific Biosciences' Single Molecule Real Time (SMRT) technology. Yet another example of a sequencing technique that can be used in the methods of the present disclosure is nanopore sequencing (Soni G V and Meller A. (2007) Clin Chem 53:1996-2001, the contents of which are incorporated herein by reference. incorporated herein in its entirety). Another example of a sequencing technique that can be used in the methods of the present disclosure includes sequencing DNA using chemically sensitive field effect transistor (chemFET) arrays (e.g., US Patent Application Publication No. 20090026082 , the contents of which are incorporated herein by reference in their entirety). Another example of a sequencing technique that can be used in the methods of the present disclosure includes the use of electron microscopy (Moudrianakis E. N. and Beer M. Proc Natl Acad Sci USA. 1965 March;53:564- 71, the contents of which are incorporated herein by reference in their entirety).

サンプルの核酸が分解されている場合、またはサンプルから最小限の量の核酸しか取得できない場合は、シーケンシングに十分な量の核酸を取得するために核酸に対してPCRを実行できる。 If the sample nucleic acid is degraded, or if only a minimal amount of nucleic acid can be obtained from the sample, PCR can be performed on the nucleic acid to obtain a sufficient amount of nucleic acid for sequencing.

コンピュータシステムおよびデバイス
本明細書に記載される開示の態様は、プロセッサ、例えば中央処理装置を含むコンピュータなどの任意のタイプのコンピューティングデバイス、または各デバイスがプロセスまたは方法の少なくとも一部を実行するコンピューティングデバイスの任意の組み合わせを使用して実行することができる。いくつかの実施形態において、本明細書に記載のシステムおよび方法は、例えばスマートタブレット、またはスマートフォンなどのハンドヘルドデバイス、あるいはシステム用に製造された特殊デバイスを用いて実行することができる。
Computer Systems and Devices Aspects of the disclosure described herein can be applied to any type of computing device, such as a computer that includes a processor, e.g., a central processing unit, or each device executes at least a portion of a process or method. Any combination of operating devices can be used. In some embodiments, the systems and methods described herein can be performed using a handheld device, such as a smart tablet or smart phone, or a specialized device manufactured for the system.

本開示の方法は、ソフトウェア、ハードウェア、ファームウェア、ハード配線、またはこれらのいずれかの組み合わせを使用して実行することができる。関数を実行する特徴(Features)は、関数の一部が異なる物理的場所(例えば、画像形成装置がある部屋にあり、ホストワークステーションが別の部屋にある、または、例えば、無線接続または有線接続で別々の建物にある)で実行されるように分散されることを含め、物理的にさまざまな位置に配置することもできる。 The methods of the present disclosure can be performed using software, hardware, firmware, hardwiring, or any combination thereof. Features that perform a function may be part of the function in different physical locations (e.g., one room with the imaging device and the host workstation in another room, or, for example, a wireless or wired connection). may be physically located in different locations, including being distributed to run in separate buildings).

コンピュータプログラムの実行に適したプロセッサには、一例として、汎用および特殊用途のマイクロプロセッサ、およびあらゆる種類のデジタルコンピュータの1つ以上のプロセッサが含まれる。一般に、プロセッサは、読み取り専用メモリまたはランダムアクセスメモリ、あるいはその両方から命令とデータを受け取る。コンピュータの本質的な要素は、命令を実行するプロセッサと、命令およびデータを記憶する1つ以上のメモリ装置である。一般に、コンピュータは、データを保存するための1つ以上の大容量記憶装置、例えば、磁気ディスク、光磁気ディスク、または光ディスクからデータを受け取る、データを転送する、またはその両方を含むか、またはそのように動作可能に結合される。コンピュータプログラム命令およびデータを具現化するのに適した情報担体には、一例として、半導体メモリデバイス(例えば、EPROM、EEPROM、ソリッドステートドライブ(SSD)、およびフラッシュメモリデバイス);磁気ディスク(例えば、内蔵ハードディスクまたはリムーバブルディスク);光磁気ディスク;および光ディスク(例えば、CDおよびDVDディスク)を含む、あらゆる形態の不揮発性メモリが含まれる。プロセッサとメモリは、特殊用途のロジック回路によって補うことも、あるいはその中に組み込むこともできる。 Processors suitable for the execution of a computer program include, by way of example, general and special purpose microprocessors, and one or more processors of any kind of digital computer. Generally, a processor receives instructions and data from read-only memory and/or random-access memory. The essential elements of a computer are a processor, which executes instructions, and one or more memory devices, which store instructions and data. Generally, a computer receives data from, transfers data from, or includes or includes one or more mass storage devices, such as magnetic, magneto-optical, or optical disks, for storing data. operably coupled to Information carriers suitable for embodying computer program instructions and data include, by way of example, semiconductor memory devices (eg, EPROM, EEPROM, solid state drives (SSD), and flash memory devices); magnetic disks (eg, internal All forms of non-volatile memory are included, including hard disks or removable disks); magneto-optical disks; and optical disks (eg, CD and DVD disks). The processor and memory may be supplemented by, or incorporated within, special-purpose logic circuitry.

ユーザとのインタラクションを提供するために、本明細書に記載の主題は、ユーザに情報を表示するための入出力装置、例えばCRT、LCD、LED、または投影装置と、ユーザがコンピュータに入力を提供することができるキーボードおよびポインティングデバイス(例えば、マウスまたはトラックボール)などの入力または出力装置とを有するコンピュータ上で実施され得る。ユーザとのインタラクションを提供するために、他の種類のデバイスを使用することもできる。例えば、ユーザに提供されるフィードバックは、あらゆる形式の感覚的フィードバック(例えば、視覚的フィードバック、聴覚的フィードバック、または触覚的フィードバック)とすることができ、ユーザからの入力は、音響、音声、または触覚入力を含むあらゆる形式で受け取ることができる。 To provide interaction with a user, the subject matter described herein uses an input/output device, such as a CRT, LCD, LED, or projection device, for displaying information to the user and for the user to provide input to the computer. It can be implemented on a computer with input or output devices such as a keyboard and pointing device (eg, mouse or trackball) capable of operating. Other types of devices can also be used to provide interaction with the user. For example, the feedback provided to the user can be any form of sensory feedback (e.g., visual, auditory, or tactile feedback), and input from the user can be acoustic, vocal, or tactile. It can be received in any form, including input.

本明細書に記載される主題は、バックエンドコンポーネント(例えば、データサーバ)、ミドルウェアコンポーネント(例えば、アプリケーションサーバ)、またはフロントエンドコンポーネント(例えば、ユーザが本明細書に記載される主題の実装と対話することができるグラフィカルユーザインターフェースまたはウェブブラウザを有するクライアントコンピュータ)、またはそのようなバックエンドコンポーネント、ミドルウェアコンポーネント、およびフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実装することができる。システムの構成要素は、デジタルデータ通信の任意の形式または媒体、例えば通信ネットワークによって、ネットワークを介して相互接続することができる。例えば、データの参照セットは遠隔地に保存され、コンピュータはネットワークを介して通信し、比較目的のために参照データセットにアクセスすることができる。しかし、他の実施形態では、参照データセットをコンピュータ内にローカルに保存することができ、コンピュータは比較目的のためにCPU内で参照データセットにアクセスする。通信ネットワークの例としては、限定されるものではないが、セルネットワーク(例えば、3Gまたは4G)、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、例えばインターネットなどが挙げられる。 The subject matter described herein may be a back-end component (e.g., data server), a middleware component (e.g., application server), or a front-end component (e.g., a client computer with a graphical user interface or web browser), or a computing system that includes any combination of such back-end components, middleware components, and front-end components. The components of the system can be interconnected through a network by any form or medium of digital data communication, eg, a communication network. For example, a reference set of data may be stored remotely and computers may communicate over a network to access the reference data set for comparison purposes. However, in other embodiments, the reference data set can be stored locally within the computer, which accesses the reference data set within the CPU for comparison purposes. Examples of communication networks include, but are not limited to, cellular networks (eg, 3G or 4G), local area networks (LAN), wide area networks (WAN), such as the Internet.

本明細書に記載の主題は、データ処理装置(例えば、プログラマブルプロセッサ、コンピュータ、または複数台のコンピュータ)による実行のため、またはデータ処理装置(例えば、プログラマブルプロセッサ、コンピュータ、または複数台のコンピュータ)の動作を制御するために、情報担体(例えば、非一過性のコンピュータ可読媒体)において当接的に具現化された1つ以上のコンピュータプログラムなど、1つ以上のコンピュータプログラム製品として実施することができる。コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、アプリ、マクロ、またはコードとしても知られている)は、コンパイル言語またはインタプリタ言語(例えば、C、C++、Perl)を含む、あらゆる形式のプログラミング言語で記述することができ、スタンドアロンプログラムとして、またはモジュール、コンポーネント、サブルーチン、またはコンピューティング環境での使用に適した他のユニットとしてなど、あらゆる形式で展開することができる。本開示のシステムおよび方法は、C、C++、Perl、Java、ActiveX、HTML5、Visual Basic、またはJavaScriptを含むがこれらに限定されない、当技術分野で知られている任意の適切なプログラミング言語で記述された命令を含むことができる。 The subject matter described herein is for execution by or of a data processing device (eg, a programmable processor, computer, or computers). may be embodied as one or more computer program products, such as one or more computer programs abuttingly embodied in an information carrier (e.g., non-transitory computer readable media) to control operation. can. Computer programs (also known as programs, software, software applications, apps, macros, or code) are written in any form of programming language, including compiled or interpreted languages (eg, C, C++, Perl) and can be deployed in any form, whether as a stand-alone program or as a module, component, subroutine, or other unit suitable for use in a computing environment. The systems and methods of the present disclosure can be written in any suitable programming language known in the art, including but not limited to C, C++, Perl, Java, ActiveX, HTML5, Visual Basic, or JavaScript. can contain instructions.

コンピュータプログラムは必ずしもファイルに対応するとは限らない。プログラムは、他のプログラムまたはデータを保持するファイルまたはファイルの一部、問題のプログラム専用の単一ファイル、または複数の調整ファイル(例えば、1つ以上のモジュール、サブモジュール、またはコードの一部を格納するファイル)に格納することができる。コンピュータプログラムは、1台のコンピュータ上で実行されるように展開することも、1つのサイトの複数台のコンピュータ上で実行されるように展開することも、複数のサイトに分散して通信ネットワークによって相互接続されることもできる。 Computer programs do not necessarily correspond to files. A program may be a file or part of a file holding other programs or data, a single file dedicated to the program in question, or multiple coordination files (e.g., one or more modules, submodules, or parts of code). file to store). A computer program may be deployed to be executed on one computer, on multiple computers at one site, distributed over multiple sites and distributed over a communications network. They can also be interconnected.

ファイルは、例えば、ハードドライブ、SSD、CD、またはその他の有形の非一時的な媒体に保存されているデジタルファイルであり得る。ファイルは、ネットワークを介して(例えば、ネットワークインターフェイスカード、モデム、ワイヤレスカードなどを介してサーバーからクライアントに送信されるパケットとして)あるデバイスから別のデバイスに送信することができる。 A file may be, for example, a digital file stored on a hard drive, SSD, CD, or other tangible non-transitory medium. Files can be sent from one device to another over a network (eg, as packets sent from a server to a client via a network interface card, modem, wireless card, etc.).

本開示によるファイルの書き込みは、例えば、粒子(例えば、正味の電荷または双極子モーメントを有する、読み取り/書き込みヘッドによる磁化のパターン)を追加、除去、または再配置することによって、有形で非一過性のコンピュータ可読媒体を変換することを含み、該パターンは、次に、ユーザによって所望され、ユーザにとって有用な客観的物理現象に関する情報の新たなコロケーションを表す。いくつかの実施形態において、書き込みは、有形で非一過性のコンピュータ可読媒体(例えば、光学的読み書きデバイスが新しい有用な情報のコロケーションを読み取ることができるように、特定の光学的特性を持つ、例えば、CD-ROMの書き込み)の材料の物理的変換を含む。いくつかの実施形態において、ファイルの書き込みは、NANDフラッシュメモリ装置のような物理的なフラッシュメモリ装置を変換し、フローティングゲートトランジスタで作られたメモリセルのアレイ内の物理的な要素を変換することによって情報を格納することを含む。ファイルを書き込む方法は当技術分野でよく知られており、例えば、プログラム、ソフトウェアからの保存コマンド、またはプログラミング言語からの書き込みコマンドによって、手動または自動的に呼び出すことができる。 The writing of files according to the present disclosure is tangible and non-transient, e.g., by adding, removing, or rearranging particles (e.g., patterns of magnetization by a read/write head that have a net charge or dipole moment). The pattern then represents a new collocation of information about objective physical phenomena desired by and useful to the user. In some embodiments, the writing is a tangible, non-transitory computer-readable medium (e.g., a computer-readable medium with specific optical properties such that an optical read/write device can read collocations of new and useful information, For example, CD-ROM writing), physical transformation of the material. In some embodiments, writing a file transforms a physical flash memory device, such as a NAND flash memory device, transforming physical elements within an array of memory cells made of floating gate transistors. including storing information by Methods for writing files are well known in the art and can be invoked manually or automatically, for example by a save command from a program, software, or a write command from a programming language.

適切なコンピューティングデバイスは、通常、マスメモリ、少なくとも1つのグラフィカルユーザインターフェース、少なくとも1つのディスプレイデバイスを含み、通常、デバイス間の通信を含む。マスメモリは、コンピュータ可読媒体、すなわちコンピュータ記憶媒体の一種を示す。コンピュータ記憶媒体には、コンピュータ可読命令、データ構造、プログラムモジュール、またはその他のデータなど、情報を記憶するためのあらゆる方法または技術で実装された、揮発性、不揮発性、取り外し可能、および取り外し不可能な媒体を含めることができる。コンピュータ記憶媒体の例としては、RAM、ROM、EEPROM、フラッシュメモリ、またはその他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)、またはその他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置、またはその他の磁気記憶装置、RFID(Radiofrequency Identification)タグまたはチップ、または所望の情報を記憶するのに使用でき、コンピューティングデバイスによってアクセス可能なその他の媒体が挙げられる。 A suitable computing device typically includes a mass memory, at least one graphical user interface, at least one display device, and typically includes communications between the devices. Mass memory refers to a type of computer-readable or computer storage media. Computer storage media includes volatile, nonvolatile, removable and non-removable implemented in any method or technology for storage of information, such as computer readable instructions, data structures, program modules or other data. media can be included. Examples of computer storage media include RAM, ROM, EEPROM, flash memory or other memory technology, CD-ROM, digital versatile disc (DVD) or other optical storage devices, magnetic cassettes, magnetic tapes, magnetic disks. Storage devices, or other magnetic storage devices, Radiofrequency Identification (RFID) tags or chips, or other media that can be used to store desired information and that are accessible by a computing device.

本明細書に記載の関数は、ソフトウェア、ハードウェア、ファームウェア、ハード配線、またはこれらのいずれかの組み合わせを使用して実行することができる。ソフトウェアのいずれかを物理的にさまざまな位置に配置することができ、関数の一部が異なる物理的な位置で実行されるように分散されることも含まれる。 The functions described herein may be performed using software, hardware, firmware, hardwiring, or any combination thereof. Any of the software may be physically located in different physical locations, including being distributed such that portions of its functions are performed in different physical locations.

当業者であれば、本開示の方法の実行に必要または最適であると認識するように、記載された本発明の方法の一部または全部を実装するためのコンピュータシステムは、1つ以上のプロセッサ(例えば、中央処理装置(CPU)、グラフィック処理装置(GPU)、またはその両方)、メインメモリ、およびスタティックメモリを含むことができ、これらはバスを介して互いに通信する。 A computer system for implementing part or all of the described methods of the present invention may include one or more processors, as those skilled in the art will recognize as necessary or optimal for carrying out the methods of the present disclosure. (eg, a central processing unit (CPU), a graphics processing unit (GPU), or both), main memory, and static memory, which communicate with each other via a bus.

プロセッサは一般に、シングルコアまたはマルチコアチップなどのチップを含み、中央処理装置(CPU)を提供する。プロセスは、インテルまたはAMDのチップによって提供されるかもしれない。 Processors generally include chips, such as single-core or multi-core chips, that provide a central processing unit (CPU). The process may be provided by Intel or AMD chips.

メモリは、開示されるコンピュータのいずれか1つのプロセッサ(複数可)によって実行されると、本明細書に記載される方法論または関数の一部または全部を達成することができる1つ以上の命令セット(例えば、ソフトウェア)が記憶される1つ以上の機械可読デバイスを含むことができる。また、ソフトウェアは、コンピュータシステムによる実行中、完全にまたは少なくとも部分的に、メインメモリ内および/またはプロセッサ内に存在する可能性がある。好ましくは、各コンピュータは、ソリッドステートドライブ、フラッシュドライブ、ディスクドライブ、ハードドライブなどの非一過性メモリを含む。 The memory is a set of one or more instructions that, when executed by the processor(s) of any one of the disclosed computers, can achieve some or all of the methodologies or functions described herein. It can include one or more machine-readable devices on which (eg, software) is stored. Also, during execution by a computer system, software may reside wholly or at least partially within main memory and/or within the processor. Each computer preferably includes non-transitory memory such as a solid state drive, flash drive, disk drive, hard drive, or the like.

機械可読デバイスは、例示的な実施形態では単一の媒体であり得、「機械可読デバイス」という用語は、1つ以上の命令セットおよび/またはデータを格納する単一の媒体または複数の媒体(例えば、集中型もしくは分散型データベース、ならびに/または関連するキャッシュおよびサーバー)を含むものと見なされるべきである。これらの用語は、機械による実行のための命令セットを記憶、符号化、または保持することが可能であり、機械に本開示の方法論のいずれか1つ以上を実行させる任意の媒体またはメディアも含むものとする。したがって、これらの用語は、限定されるものではないが、1つ以上のソリッドステートメモリ(例えば、加入者IDモジュール(SIM)カード、セキュアデジタルカード(SDカード)、マイクロSDカード、またはソリッドステートドライブ(SSD))、光学および磁気媒体、ならびに/または他の任意の有形記憶媒体またはメディアを含む。 A machine-readable device may be a single medium in an exemplary embodiment, and the term "machine-readable device" may refer to a single medium or multiple media ( for example, centralized or distributed databases, and/or associated caches and servers). These terms also include any medium or media capable of storing, encoding, or retaining a set of instructions for execution by a machine and causing the machine to perform any one or more of the methodologies of the present disclosure. shall be taken. As such, these terms include, but are not limited to, one or more solid state memory (e.g., Subscriber Identity Module (SIM) card, Secure Digital card (SD card), Micro SD card, or solid state drive). (SSD)), optical and magnetic media, and/or any other tangible storage medium or media.

本開示のコンピュータは、一般に、例えば、ビデオディスプレイユニット(例えば、液晶ディスプレイ(LCD)または陰極線管(CRT))、英数字入力デバイス(例えば、キーボード)、カーソル制御デバイス(例えば、マウス)、ディスクドライブユニット、信号発生デバイス(例えば、スピーカ)、タッチスクリーン、加速度計、マイクロフォン、携帯無線周波数アンテナ、およびネットワークインターフェイスデバイスのうちの1つ以上などの1つ以上のI/Oデバイスを含み、これらは、例えば、ネットワークインターフェイスカード(NIC)、Wi-Fiカード、またはセルラーモデムであり得る。 Computers of the present disclosure generally include, for example, a video display unit (e.g., liquid crystal display (LCD) or cathode ray tube (CRT)), an alphanumeric input device (e.g., keyboard), a cursor control device (e.g., mouse), a disk drive unit , signal generating devices (e.g., speakers), touch screens, accelerometers, microphones, portable radio frequency antennas, and one or more of network interface devices, which include, for example, , a network interface card (NIC), a Wi-Fi card, or a cellular modem.

ソフトウェアのいずれかを物理的にさまざまな位置に配置することができ、関数の一部が異なる物理的な位置で実行されるように分散されることも含まれる。 Any of the software may be physically located in different physical locations, including being distributed such that portions of its functions are performed in different physical locations.

さらに、本開示のシステムは、参照データを含むように提供され得る。任意の適切なゲノムデータを、システム内で使用するために保存することができる。例えば、限定されるものではないが、以下のようなものが挙げられる:例えば、The Cancer Genome Atlas (TCGA)による主要な癌の種類およびサブタイプにおける主要なゲノム変化の包括的な多次元マップ;International Cancer Genome Consortium(ICGC)によるゲノム異常のカタログ;COSMICによる癌の体細胞突然変異のカタログ;ヒトゲノムおよびその他の一般的なモデル生物の最新ビルド;dbSNPからの最新の参照SNP;1000 Genomes ProjectおよびBroad Instituteからのゴールドスタンダードインデル;Illumina社、Agilent社、Nimblegen社、およびIon Torrent社からのエクソームキャプチャーキットのアノテーション;転写産物のアノテーション;パイプラインの実験用の小規模なテストデータ(例えば、新規ユーザ向け)。 Additionally, the system of the present disclosure can be provided to include reference data. Any suitable genomic data can be stored for use within the system. Examples include, but are not limited to: comprehensive multidimensional maps of major genomic alterations in major cancer types and subtypes, such as from The Cancer Genome Atlas (TCGA); Catalog of genomic aberrations by the International Cancer Genome Consortium (ICGC); catalog of somatic mutations in cancer by COSMIC; latest builds of the human genome and other common model organisms; latest reference SNPs from dbSNP; 1000 Genomes Project and Broad gold standard indels from the Institute; exome capture kit annotations from Illumina, Agilent, Nimblegen, and Ion Torrent; transcript annotations; small test data for pipeline experiments (e.g., novel user).

いくつかの実施形態において、データは、システムに含まれるデータベースのコンテキスト内で利用可能になる。リレーショナルデータベース、オブジェクト指向データベースなど、適切なデータベース構造を使用することができる。いくつかの実施形態において、参照データは、「SQLのみではない」(NoSQL)データベースなどのリレーショナルデータベースに格納される。さまざまな実施形態において、グラフデータベースは、本開示のシステム内に含まれる。また、本明細書で使用する「データベース」という用語は、単一のデータベースに限定されるものではなく、むしろ複数のデータベースをシステムに含めることができることを理解されたい。例えば、本開示の実施形態によれば、データベースは、その中に、任意の整数のデータベースなど、2、3、4、5、6、7、8、9、10、15、20、またはそれ以上の個々のデータベースを含むことができる。例えば、1つのデータベースは公的な参照データを、2つ目のデータベースは患者からの試験データを、3つ目のデータベースは健常対象からのデータを、4つ目のデータベースは既知の状態または障害を有する病気の対象からのデータを含むことができる。その中に含まれるデータに関するデータベースの他の構成も、本明細書に記載される方法によって企図されることを理解されたい。 In some embodiments, data is made available within the context of databases contained in the system. Any suitable database structure can be used, such as a relational database, an object-oriented database, or the like. In some embodiments, the reference data is stored in a relational database, such as a "not SQL only" (NoSQL) database. In various embodiments, a graph database is included within the system of the present disclosure. Also, it should be understood that the term "database" as used herein is not limited to a single database, but rather multiple databases can be included in the system. For example, according to embodiments of the present disclosure, a database may include 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, or more, such as any integer database therein. can contain individual databases of For example, one database contains public reference data, a second database contains trial data from patients, a third database contains data from healthy subjects, and a fourth database contains known conditions or disorders. can include data from subjects ill with It should be understood that other configurations of databases for data contained therein are also contemplated by the methods described herein.

例示的な実施形態(A)
本開示は、以下の実施形態を提供する。
Exemplary embodiment (A)
The present disclosure provides the following embodiments.

実施形態P1.対象における癌を検出する方法であって、
(a)前記対象のサンプル中の複数の標的無細胞RNA(cfRNA)分子を測定することであって、前記複数の標的cfRNA分子は表11、任意に表12~15に記載された1つ以上の転写産物から選択される、測定すること;および
(b)閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することを含む、前記癌を検出すること
を含む、方法。
Embodiment P1. A method of detecting cancer in a subject, comprising:
(a) measuring a plurality of target cell-free RNA (cfRNA) molecules in a sample of said subject, said plurality of target cfRNA molecules being one or more listed in Table 11, optionally Tables 12-15; and (b) detecting said cancer comprising detecting one or more of said target cfRNA molecules above a threshold level.

実施形態P2.前記複数の標的cfRNA分子が、表11~14に記載された少なくとも5、10、15または20個の転写産物から選択される、実施形態P1の方法。 Embodiment P2. The method of embodiment P1, wherein said plurality of target cfRNA molecules is selected from at least 5, 10, 15 or 20 transcripts listed in Tables 11-14.

実施形態P3.前記複数の標的cfRNA分子が、(i)表11;(ii)表2、5および12のそれぞれ;(iii)表3、4、6および13のそれぞれ;または(iv)表14に記載された複数の転写産物を含む、実施形態P1またはP2の方法。 Embodiment P3. (ii) each of Tables 2, 5 and 12; (iii) each of Tables 3, 4, 6 and 13; or (iv) Table 14. The method of embodiment P1 or P2 comprising multiple transcripts.

実施形態P4.前記複数の標的cfRNA分子が、表11~15のうちの1つ以上に記載されたすべての転写産物を含む、実施形態P1~P3のいずれか1つの方法。 Embodiment P4. The method of any one of embodiments P1-P3, wherein said plurality of target cfRNA molecules comprises all transcripts listed in one or more of Tables 11-15.

実施形態P5.前記複数の標的cfRNA分子が、表14の転写産物から選択される、実施形態P1~P4のいずれか1つの方法。 Embodiment P5. The method of any one of embodiments P1-P4, wherein said plurality of target cfRNA molecules are selected from the transcripts of Table 14.

実施形態P6.閾値を超えて検出された前記複数の標的cfRNA分子は、ADIPOQ、AGR3、ANKRD30A、AQP4、BPIFA1、CA12、CEACAM5、CFTR、CXCL17、CYP4F8、FABP7、FOXI1、GGTLC1、GP2、IL20、ITIH6、LDLRAD1、LEMD1、LMX1B、MMP7、NKAIN1、NKX2-1、ROPN1、ROS1、SCGB1D2、SCGB2A2、SFTA2、SFTA3、SLC34A2、SOX9、STK32A、STMND1、TFAP2A、TFAP2B、TFF1、TRPV6、VGLL1およびVTCN1からなる群から選択される複数の遺伝子に由来するcfRNA分子である、実施形態P1~P5のいずれか1つの方法。 Embodiment P6. The plurality of target cfRNA molecules detected above threshold are ADIPOQ, AGR3, ANKRD30A, AQP4, BPIFA1, CA12, CEACAM5, CFTR, CXCL17, CYP4F8, FABP7, FOXI1, GGTLC1, GP2, IL20, ITIH6, LDLRAD1, LEMD1 , LMX1B, MMP7, NKAIN1, NKX2-1, ROPN1, ROS1, SCGB1D2, SCGB2A2, SFTA2, SFTA3, SLC34A2, SOX9, STK32A, STMND1, TFAP2A, TFAP2B, TFF1, TRPV6, VGLL1 and VTCN1 The method of any one of embodiments P1-P5, wherein the cfRNA molecule is derived from the gene of

実施形態P7.前記複数の標的cfRNA分子は、表11~14のうちの1つ以上の転写産物、および表1~6の1つ以上の転写産物を含む、実施形態P1~P6のいずれか1つの方法。 Embodiment P7. The method of any one of embodiments P1-P6, wherein said plurality of target cfRNA molecules comprises one or more transcripts of Tables 11-14 and one or more transcripts of Tables 1-6.

実施形態P8.前記複数の標的cfRNA分子は、表11~14のうちの1つ以上の転写産物、および表7の1つ以上の転写産物を含む、実施形態P1~P7のいずれか1つの方法。 Embodiment P8. The method of any one of embodiments P1-P7, wherein said plurality of target cfRNA molecules comprises one or more transcripts of Tables 11-14 and one or more transcripts of Table 7.

実施形態P9.(i)前記癌は肺癌であり、(ii)閾値を超えて検出された前記複数の標的cfRNA分子は、表2、5および12のうちの1つ以上の転写産物から選択される、実施形態P1~P4のいずれか1つの方法。 Embodiment P9. Embodiments wherein (i) said cancer is lung cancer, and (ii) said plurality of target cfRNA molecules detected above a threshold are selected from one or more transcripts of Tables 2, 5 and 12. The method of any one of P1-P4.

実施形態P10.(i)前記癌は乳癌であり、(ii)閾値を超えて検出された前記複数の標的cfRNA分子は、表3、4、6および13のうちの1つ以上の転写産物から選択される、実施形態P1~P4のいずれか1つの方法。 Embodiment P10. (i) the cancer is breast cancer, and (ii) the plurality of target cfRNA molecules detected above a threshold is selected from one or more transcripts of Tables 3, 4, 6 and 13; The method of any one of embodiments P1-P4.

実施形態P11.前記測定することは、シーケンシング、マイクロアレイ分析、逆転写PCR、リアルタイムPCR、定量的リアルタイムPCR、デジタルPCR、デジタル液滴PCR(digital droplet PCR)、デジタルエマルジョンPCR、マルチプレックスPCR、ハイブリッド捕捉(hybrid capture)、オリゴヌクレオチドライゲーションアッセイ、またはそれらの任意の組み合わせを含む、実施形態P1~P10のいずれか1つの方法。 Embodiment P11. Said measuring includes sequencing, microarray analysis, reverse transcription PCR, real-time PCR, quantitative real-time PCR, digital PCR, digital droplet PCR, digital emulsion PCR, multiplex PCR, hybrid capture. ), oligonucleotide ligation assays, or any combination thereof.

実施形態P12.前記測定することは、cfRNA分子をシーケンシングしてcfRNA配列リードを生成することを含む、実施形態P1~P11のいずれか1つの方法。 Embodiment P12. The method of any one of embodiments P1-P11, wherein said determining comprises sequencing the cfRNA molecule to generate cfRNA sequence reads.

実施形態P13.前記cfRNA分子をシーケンシングすることは、全トランスクリプトームシーケンシングを含む、実施形態P12の方法。 Embodiment P13. The method of embodiment P12, wherein sequencing said cfRNA molecules comprises whole transcriptome sequencing.

実施形態P14.前記cfRNA分子をシーケンシングすることは、cDNA分子を生成するための逆転写と、前記cfRNA配列リードを生成するために前記cDNA分子をシーケンシングすることを含む、実施形態P12またはP13の方法。 Embodiment P14. The method of embodiment P12 or P13, wherein sequencing said cfRNA molecule comprises reverse transcription to generate a cDNA molecule and sequencing said cDNA molecule to generate said cfRNA sequence reads.

実施形態P15.前記cfRNA分子をシーケンシングすることは、前記標的cfRNA分子またはそのcDNA分子を濃縮することを含む、実施形態P12の方法。 Embodiment P15. The method of embodiment P12, wherein sequencing said cfRNA molecules comprises enriching for said target cfRNA molecules or cDNA molecules thereof.

実施形態P16.前記サンプルが生体液を含む、実施形態P1~P15のいずれか1つの方法。 Embodiment P16. The method of any one of embodiments P1-P15, wherein said sample comprises a biological fluid.

実施形態P17.前記生体液は、血液、血漿、血清、尿、唾液、胸水、心膜液、脳脊髄液(CSF)、腹膜液、またはそれらの任意の組み合わせを含む、実施形態P16の方法。 Embodiment P17. The method of embodiment P16, wherein the biological fluid comprises blood, plasma, serum, urine, saliva, pleural effusion, pericardial fluid, cerebrospinal fluid (CSF), peritoneal fluid, or any combination thereof.

実施形態P18.前記生物学的物質は、前記対象の血液、血液フラクション、血漿または血清を含む、実施形態P16の方法。 Embodiment P18. The method of embodiment P16, wherein said biological material comprises blood, blood fractions, plasma or serum of said subject.

実施形態P19.閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することが、(i)検出、(ii)バックグラウンドを超える検出、または(iii)前記状態を有さない対象における前記標的cfRNA分子のレベルよりも高いレベルでの検出を含む、実施形態P1~P18のいずれか1つの方法。 Embodiment P19. Detecting one or more of said target cfRNA molecules above a threshold level is defined as (i) detection, (ii) detection above background, or (iii) levels of said target cfRNA molecules in a subject without said condition. The method of any one of embodiments P1-P18, comprising detection at a higher level than.

実施形態P20.閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することが、前記状態を有さない対象におけるレベルよりも少なくとも約10倍高いレベルで、前記1つ以上の標的cfRNA分子を検出することを含む、実施形態P1~P18のいずれか1つの方法。 Embodiment P20. wherein detecting one or more of said target cfRNA molecules above a threshold level detects said one or more target cfRNA molecules at a level at least about 10-fold higher than a level in a subject without said condition. The method of any one of embodiments P1 through P18, comprising:

実施形態P21.閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することが、0.5~5リード・パー・ミリオン(reads per million(RPM))の閾値を超える検出を含む、実施形態P12~P18のいずれか1つの方法。 Embodiment P21. of embodiments P12-P18, wherein detecting one or more of said target cfRNA molecules above a threshold level comprises detecting above a threshold of 0.5-5 reads per million (RPM). any one method.

実施形態P22.閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することは、
(a)各標的cfRNA分子の指標スコアを、前記標的cfRNA分子の各々の発現レベルをRNA組織スコア行列と比較することにより決定すること;
(b)各標的cfRNA分子の前記指標スコアを集計すること;および
(c)前記指標スコアが閾値を超えるときに前記癌を検出すること;
を含む、実施形態P1~P18のいずれか1つの方法。
Embodiment P22. Detecting one or more of said target cfRNA molecules above a threshold level comprises:
(a) determining an index score for each target cfRNA molecule by comparing the expression level of each of said target cfRNA molecules to an RNA tissue score matrix;
(b) summarizing said index score for each target cfRNA molecule; and (c) detecting said cancer when said index score exceeds a threshold;
The method of any one of embodiments P1-P18, comprising

実施形態P23.閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することが、前記配列リードを機械学習または深層学習モデルに入力することを含む、実施形態P12~P22のいずれか1つの方法。 Embodiment P23. The method of any one of embodiments P12-P22, wherein detecting one or more of said target cfRNA molecules above a threshold level comprises inputting said sequence reads into a machine learning or deep learning model.

実施形態P24.前記機械学習または深層学習モデルは、ロジスティック回帰、ランダムフォレスト、勾配ブースティングマシン、ナイーブベイズ、ニューラルネットワーク、または多項式回帰を含む、実施形態P23の方法。 Embodiment P24. The method of embodiment P23, wherein the machine learning or deep learning model comprises logistic regression, random forest, gradient boosting machine, naive Bayes, neural network, or polynomial regression.

実施形態P25.前記機械学習または深層学習モデルが、学習された重み(learned weights)を含む関数を介して、前記1つ以上の特徴の値を前記対象の前記疾患状態予測に変換する、実施形態P23の方法。 Embodiment P25. The method of embodiment P23, wherein the machine learning or deep learning model converts the values of the one or more features into the disease state prediction of the subject via a function comprising learned weights.

実施形態P26.前記癌は、
(i)癌腫、肉腫、骨髄腫、白血病、リンパ腫、芽細胞腫、胚細胞腫瘍、またはそれらの任意の組み合わせ;
(ii)腺癌、扁平上皮癌、小細胞肺癌、非小細胞肺癌、上咽頭癌、結腸直腸癌、肛門癌、肝臓癌、膀胱癌、精巣癌、子宮頸癌、卵巣癌、胃癌、食道癌、頭頸部癌、膵臓癌、前立腺癌、腎臓癌、甲状腺癌、メラノーマおよび乳癌からなる群から選択される癌腫;
(iii)ホルモン受容体陰性乳癌またはトリプルネガティブ乳癌;
(iv)骨肉腫、軟骨肉腫、平滑筋肉腫、横紋筋肉腫、中皮肉腫(中皮腫)、線維肉腫、血管肉腫、脂肪肉腫、神経膠腫および星細胞腫からなる群から選択される肉腫;
(v)骨髄性白血病、顆粒球性白血病、リンパ性白血病、リンパ球性白血病およびリンパ芽球性白血病からなる群から選択される白血病;または
(vi)ホジキンリンパ腫および非ホジキンリンパ腫からなる群から選択されるリンパ腫
を含む、実施形態P1~P25のいずれか1つの方法。
Embodiment P26. The cancer is
(i) carcinoma, sarcoma, myeloma, leukemia, lymphoma, blastoma, germ cell tumor, or any combination thereof;
(ii) adenocarcinoma, squamous cell carcinoma, small cell lung cancer, non-small cell lung cancer, nasopharyngeal cancer, colorectal cancer, anal cancer, liver cancer, bladder cancer, testicular cancer, cervical cancer, ovarian cancer, gastric cancer, esophageal cancer , head and neck cancer, pancreatic cancer, prostate cancer, renal cancer, thyroid cancer, melanoma and breast cancer;
(iii) hormone receptor negative or triple negative breast cancer;
(iv) selected from the group consisting of osteosarcoma, chondrosarcoma, leiomyosarcoma, rhabdomyosarcoma, mesothelioma (mesothelioma), fibrosarcoma, angiosarcoma, liposarcoma, glioma and astrocytoma sarcoma;
(v) a leukemia selected from the group consisting of myeloid leukemia, granulocytic leukemia, lymphocytic leukemia, lymphocytic leukemia and lymphoblastic leukemia; or (vi) selected from the group consisting of Hodgkin's lymphoma and non-Hodgkin's lymphoma. The method of any one of embodiments P1-P25, wherein the lymphoma is a lymphoma.

実施形態P27.前記癌を検出することが、癌のステージを決定すること、癌の進行を決定すること、癌の種類を決定すること、癌の起源組織を決定すること、またはそれらの組み合わせを含む、実施形態P1~P26のいずれか1つの方法。 Embodiment P27. Embodiments wherein said detecting cancer comprises determining the stage of the cancer, determining the progression of the cancer, determining the type of cancer, determining the tissue of origin of the cancer, or combinations thereof The method of any one of P1-P26.

実施形態P28.検出された前記癌に基づいて処置を選択することをさらに含む、実施形態P1~P27のいずれか1つの方法。 Embodiment P28. The method of any one of embodiments P1-P27, further comprising selecting treatment based on said cancer detected.

実施形態P29.前記処置は、外科的切除、放射線療法、または抗癌剤の投与を含む、実施形態P28の方法。 Embodiment P29. The method of embodiment P28, wherein said treatment comprises surgical resection, radiation therapy, or administration of anti-cancer agents.

実施形態P30.前記選択された処置で前記対象を処置することをさらに含む、実施形態P28またはP29の方法。 Embodiment P30. The method of embodiment P28 or P29, further comprising treating said subject with said selected treatment.

実施形態P31.実施形態P1~P30のいずれか1つの方法における1つ以上のステップを実装するためのコンピュータシステム。 Embodiment P31. A computer system for implementing one or more steps in the method of any one of embodiments P1-P30.

実施形態P32.実施形態P1~P30のいずれか1つの方法における1つ以上のステップを実装するためのコンピュータ可読命令を格納した、非一時的なコンピュータ可読媒体。 Embodiment P32. A non-transitory computer-readable medium storing computer-readable instructions for implementing one or more steps in the method of any one of embodiments P1-P30.

例示的な実施形態(B)
本開示は、以下の実施形態を提供する。
Exemplary embodiment (B)
The present disclosure provides the following embodiments.

実施形態1.対象における癌を検出する方法であって、
(a)前記対象のサンプル中の複数の標的無細胞RNA(cfRNA)分子を測定することであって、前記複数の標的cfRNA分子は表11に記載された1つ以上の転写産物から選択される、測定すること;および
(b)閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することを含む、前記癌を検出すること
を含む、方法。
Embodiment 1. A method of detecting cancer in a subject, comprising:
(a) measuring a plurality of target cell-free RNA (cfRNA) molecules in a sample of said subject, said plurality of target cfRNA molecules being selected from one or more transcripts listed in Table 11; , measuring; and (b) detecting said cancer comprising detecting one or more of said target cfRNA molecules above a threshold level.

実施形態2.前記複数の標的cfRNA分子が、表8および表12~15のうちの1つ以上から選択される、実施形態1の方法。 Embodiment 2. The method of embodiment 1, wherein said plurality of target cfRNA molecules are selected from one or more of Tables 8 and 12-15.

実施形態3.前記複数の標的cfRNA分子が、表8および表11~14のうちの1つ以上に記載された少なくとも5、10、15または20個の遺伝子の転写産物から選択される、実施形態1の方法。 Embodiment 3. 2. The method of embodiment 1, wherein said plurality of target cfRNA molecules are selected from transcripts of at least 5, 10, 15 or 20 genes listed in one or more of Tables 8 and Tables 11-14.

実施形態4.前記複数の標的cfRNA分子が、(i)表11;(ii)表2、5および12のそれぞれ;(iii)表3、4、6および13のそれぞれ;(iv)表14;または(v)表8に記載された複数の転写産物を含む、実施形態1または3の方法。 Embodiment 4. (ii) each of Tables 2, 5 and 12; (iii) each of Tables 3, 4, 6 and 13; (iv) Table 14; or (v) The method of embodiment 1 or 3, comprising a plurality of transcripts listed in Table 8.

実施形態5.前記複数の標的cfRNA分子が、表8および表11~15のうちの1つ以上に記載された少なくとも30個の遺伝子の転写産物を含む、実施形態1~4のいずれか1つの方法。 Embodiment 5. The method of any one of embodiments 1-4, wherein said plurality of target cfRNA molecules comprises transcripts of at least 30 genes listed in one or more of Table 8 and Tables 11-15.

実施形態6.前記複数の標的cfRNA分子が、表14の転写産物から選択される、実施形態1~5のいずれか1つの方法。 Embodiment 6. The method of any one of embodiments 1-5, wherein said plurality of target cfRNA molecules are selected from the transcripts of Table 14.

実施形態7.閾値を超えて検出された前記複数の標的cfRNA分子は、ADIPOQ、AGR3、ANKRD30A、AQP4、BPIFA1、CA12、CEACAM5、CFTR、CXCL17、CYP4F8、FABP7、FOXI1、GGTLC1、GP2、IL20、ITIH6、LDLRAD1、LEMD1、LMX1B、MMP7、NKAIN1、NKX2-1、ROPN1、ROS1、SCGB1D2、SCGB2A2、SFTA2、SFTA3、SLC34A2、SOX9、STK32A、STMND1、TFAP2A、TFAP2B、TFF1、TRPV6、VGLL1およびVTCN1からなる群から選択される複数の遺伝子に由来するcfRNA分子である、実施形態1~6のいずれか1つの方法。 Embodiment 7. The plurality of target cfRNA molecules detected above threshold are ADIPOQ, AGR3, ANKRD30A, AQP4, BPIFA1, CA12, CEACAM5, CFTR, CXCL17, CYP4F8, FABP7, FOXI1, GGTLC1, GP2, IL20, ITIH6, LDLRAD1, LEMD1 , LMX1B, MMP7, NKAIN1, NKX2-1, ROPN1, ROS1, SCGB1D2, SCGB2A2, SFTA2, SFTA3, SLC34A2, SOX9, STK32A, STMND1, TFAP2A, TFAP2B, TFF1, TRPV6, VGLL1 and VTCN1 7. The method of any one of embodiments 1-6, wherein the cfRNA molecule is derived from the gene of

実施形態8.前記複数の標的cfRNA分子が、表8の転写産物から選択される、1~5のいずれか1つの方法。 Embodiment 8. The method of any one of 1-5, wherein said plurality of target cfRNA molecules is selected from the transcripts of Table 8.

実施形態9.閾値を超えて検出された前記複数の標的cfRNA分子は、CEACAM5、RHOV、SFTA2、SCGB1D2、IGF2BP1、SFTPA1、CA12、SFTPB、CDH3、MUC6、SLC6A14、HOXC9、AGR3、TMEM125、TFAP2B、IRX2、POTEKP、ARHGEF38、GPR87、LMX1B、ATP10B、NELL1、MUC21、SOX9、LINC00993、STMND1、ERVH48-1、SCTR、MAGEA3、MB、LEMD1、SIX4およびNXNL2からなる群から選択される複数の遺伝子に由来するcfRNA分子である、実施形態1~5のいずれか1つの方法。 Embodiment 9. The plurality of target cfRNA molecules detected above threshold are CEACAM5, RHOV, SFTA2, SCGB1D2, IGF2BP1, SFTPA1, CA12, SFTPB, CDH3, MUC6, SLC6A14, HOXC9, AGR3, TMEM125, TFAP2B, IRX2, POTEKP, ARHGEF38 , GPR87, LMX1B, ATP10B, NELL1, MUC21, SOX9, LINC00993, STMND1, ERVH48-1, SCTR, MAGEA3, MB, LEMD1, SIX4 and NXNL2. The method of any one of embodiments 1-5.

実施形態10.前記複数の標的cfRNA分子は、(a)表8および表11~14のうちの1つ以上の転写産物、および(b)表1~6の1つ以上の転写産物を含む、実施形態1~9のいずれか1つの方法。 Embodiment 10. Embodiments 1-1, wherein said plurality of target cfRNA molecules comprises (a) one or more transcripts of Tables 8 and 11-14 and (b) one or more transcripts of Tables 1-6 9. The method of any one of 9.

実施形態11.前記複数の標的cfRNA分子は、(a)表8および表11~14のうちの1つ以上の転写産物、および(b)表7の1つ以上の転写産物を含む、実施形態1~10のいずれか1つの方法。 Embodiment 11. 11. The method of embodiments 1-10, wherein said plurality of target cfRNA molecules comprises (a) one or more transcripts of Tables 8 and 11-14, and (b) one or more transcripts of Table 7. any one method.

実施形態12.(i)前記癌は肺癌であり、(ii)閾値を超えて検出された前記複数の標的cfRNA分子は、表2、5および12のうちの1つ以上の転写産物から選択される、実施形態1~5のいずれか1つの方法。 Embodiment 12. Embodiments wherein (i) said cancer is lung cancer, and (ii) said plurality of target cfRNA molecules detected above a threshold are selected from one or more transcripts of Tables 2, 5 and 12. Any one method of 1-5.

実施形態13.(i)前記癌は乳癌であり、(ii)閾値を超えて検出された前記複数の標的cfRNA分子は、表3、4、6および13のうちの1つ以上の転写産物から選択される、実施形態1~5のいずれか1つの方法。 Embodiment 13. (i) the cancer is breast cancer, and (ii) the plurality of target cfRNA molecules detected above a threshold is selected from one or more transcripts of Tables 3, 4, 6 and 13; The method of any one of embodiments 1-5.

実施形態14.前記測定することは、シーケンシング、マイクロアレイ分析、逆転写PCR、リアルタイムPCR、定量的リアルタイムPCR、デジタルPCR、デジタル液滴PCR(digital droplet PCR)、デジタルエマルジョンPCR、マルチプレックスPCR、ハイブリッド捕捉(hybrid capture)、オリゴヌクレオチドライゲーションアッセイ、またはそれらの任意の組み合わせを含む、実施形態1~13のいずれか1つの方法。 Embodiment 14. Said measuring includes sequencing, microarray analysis, reverse transcription PCR, real-time PCR, quantitative real-time PCR, digital PCR, digital droplet PCR, digital emulsion PCR, multiplex PCR, hybrid capture. ), oligonucleotide ligation assays, or any combination thereof.

実施形態15.前記測定することは、cfRNA分子をシーケンシングしてcfRNA配列リードを生成することを含む、実施形態1~14のいずれか1つの方法。 Embodiment 15. 15. The method of any one of embodiments 1-14, wherein said determining comprises sequencing the cfRNA molecule to generate cfRNA sequence reads.

実施形態16.前記cfRNA分子をシーケンシングすることは、全トランスクリプトームシーケンシングを含む、実施形態15の方法。 Embodiment 16. 16. The method of embodiment 15, wherein sequencing said cfRNA molecule comprises whole transcriptome sequencing.

実施形態17.前記cfRNA分子をシーケンシングすることは、cDNA分子を生成するための逆転写と、前記cfRNA配列リードを生成するために前記cDNA分子をシーケンシングすることを含む、実施形態15または16の方法。 Embodiment 17. 17. The method of embodiment 15 or 16, wherein sequencing said cfRNA molecule comprises reverse transcription to generate a cDNA molecule and sequencing said cDNA molecule to generate said cfRNA sequence reads.

実施形態18.前記cfRNA分子をシーケンシングすることは、前記標的cfRNA分子またはそのcDNA分子を濃縮することを含む、実施形態15の方法。 Embodiment 18. 16. The method of embodiment 15, wherein sequencing said cfRNA molecules comprises enriching for said target cfRNA molecules or cDNA molecules thereof.

実施形態19.前記サンプルが生体液を含む、実施形態1~18のいずれか1つの方法。 Embodiment 19. 19. The method of any one of embodiments 1-18, wherein said sample comprises a biological fluid.

実施形態20.前記生体液が、血液、血漿、血清、尿、唾液、胸水、心膜液、脳脊髄液(CSF)、腹水、またはそれらの任意の組み合わせを含む、実施形態19の方法。 Embodiment 20. 20. The method of embodiment 19, wherein said biological fluid comprises blood, plasma, serum, urine, saliva, pleural effusion, pericardial fluid, cerebrospinal fluid (CSF), ascites fluid, or any combination thereof.

実施形態21.前記生物学的物質が、前記対象の血液、血液フラクション、血漿または血清を含む、実施形態19の方法。 Embodiment 21. 20. The method of embodiment 19, wherein said biological material comprises blood, blood fractions, plasma or serum of said subject.

実施形態22.閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することが、(i)検出、(ii)バックグラウンドを超える検出、または(iii)前記状態を有さない対象における前記標的cfRNA分子のレベルよりも高いレベルでの検出を含む、実施形態1~21のいずれか1つの方法。 Embodiment 22. Detecting one or more of said target cfRNA molecules above a threshold level is defined as (i) detection, (ii) detection above background, or (iii) levels of said target cfRNA molecules in a subject without said condition. 22. The method of any one of embodiments 1-21, comprising detection at a higher level than.

実施形態23.閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することが、前記状態を有さない対象におけるレベルよりも少なくとも10倍高いレベルで、前記1つ以上の標的cfRNA分子を検出することを含む、実施形態1~21のいずれか1つの方法。 Embodiment 23. Detecting one or more of said target cfRNA molecules above a threshold level comprises detecting said one or more target cfRNA molecules at a level that is at least 10-fold greater than a level in a subject without said condition. , the method of any one of embodiments 1-21.

実施形態24.閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することが、0.5~5リード・パー・ミリオン(reads per million(RPM))の閾値を超える検出を含む、実施形態15~21のいずれか1つの方法。 Embodiment 24. 22. The method of embodiments 15-21, wherein detecting one or more of said target cfRNA molecules above a threshold level comprises detecting above a threshold of 0.5-5 reads per million (RPM). any one method.

実施形態25.閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することは、
(a)各標的cfRNA分子の指標スコアを、前記標的cfRNA分子の各々の発現レベルをRNA組織スコア行列と比較することにより決定すること;
(b)各標的cfRNA分子の前記指標スコアを集計すること;および
(c)前記指標スコアが閾値を超えるときに前記癌を検出すること
を含む、実施形態1~21のいずれか1つの方法。
Embodiment 25. Detecting one or more of said target cfRNA molecules above a threshold level comprises:
(a) determining an index score for each target cfRNA molecule by comparing the expression level of each of said target cfRNA molecules to an RNA tissue score matrix;
(b) aggregating said index score for each target cfRNA molecule; and (c) detecting said cancer when said index score exceeds a threshold.

実施形態26.閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することが、前記配列リードを機械学習または深層学習モデルに入力することを含む、実施形態15~25のいずれか1つの方法。 Embodiment 26. 26. The method of any one of embodiments 15-25, wherein detecting one or more of said target cfRNA molecules above a threshold level comprises inputting said sequence reads into a machine learning or deep learning model.

実施形態27.前記機械学習または深層学習モデルは、ロジスティック回帰、ランダムフォレスト、勾配ブースティングマシン、ナイーブベイズ、ニューラルネットワーク、または多項式回帰を含む、実施形態26の方法。 Embodiment 27. 27. The method of embodiment 26, wherein the machine learning or deep learning model comprises logistic regression, random forest, gradient boosting machine, naive Bayes, neural network, or polynomial regression.

実施形態28.前記機械学習または深層学習モデルが、学習された重み(learned weights)を含む関数を介して、前記1つ以上の特徴の値を前記対象の前記疾患状態予測に変換する、実施形態26の方法。 Embodiment 28. 27. The method of embodiment 26, wherein the machine learning or deep learning model converts the values of the one or more features into the disease state prediction of the subject via a function comprising learned weights.

実施形態29.前記癌は、
(i)癌腫、肉腫、骨髄腫、白血病、リンパ腫、芽細胞腫、胚細胞腫瘍、またはそれらの任意の組み合わせ;
(ii)腺癌、扁平上皮癌、小細胞肺癌、非小細胞肺癌、上咽頭癌、結腸直腸癌、肛門癌、肝臓癌、膀胱癌、精巣癌、子宮頸癌、卵巣癌、胃癌、食道癌、頭頸部癌、膵臓癌、前立腺癌、腎臓癌、甲状腺癌、メラノーマおよび乳癌からなる群から選択される癌腫;
(iii)ホルモン受容体陰性乳癌またはトリプルネガティブ乳癌;
(iv)骨肉腫、軟骨肉腫、平滑筋肉腫、横紋筋肉腫、中皮肉腫(中皮腫)、線維肉腫、血管肉腫、脂肪肉腫、神経膠腫および星細胞腫からなる群から選択される肉腫;
(v)骨髄性白血病、顆粒球性白血病、リンパ性白血病、リンパ球性白血病およびリンパ芽球性白血病からなる群から選択される白血病;または
(vi)ホジキンリンパ腫および非ホジキンリンパ腫からなる群から選択されるリンパ腫
を含む、実施形態1~28のいずれか1つの方法。
Embodiment 29. The cancer is
(i) carcinoma, sarcoma, myeloma, leukemia, lymphoma, blastoma, germ cell tumor, or any combination thereof;
(ii) adenocarcinoma, squamous cell carcinoma, small cell lung cancer, non-small cell lung cancer, nasopharyngeal cancer, colorectal cancer, anal cancer, liver cancer, bladder cancer, testicular cancer, cervical cancer, ovarian cancer, gastric cancer, esophageal cancer , head and neck cancer, pancreatic cancer, prostate cancer, renal cancer, thyroid cancer, melanoma and breast cancer;
(iii) hormone receptor negative or triple negative breast cancer;
(iv) selected from the group consisting of osteosarcoma, chondrosarcoma, leiomyosarcoma, rhabdomyosarcoma, mesothelioma (mesothelioma), fibrosarcoma, angiosarcoma, liposarcoma, glioma and astrocytoma sarcoma;
(v) a leukemia selected from the group consisting of myeloid leukemia, granulocytic leukemia, lymphocytic leukemia, lymphocytic leukemia and lymphoblastic leukemia; or (vi) selected from the group consisting of Hodgkin's lymphoma and non-Hodgkin's lymphoma. 29. The method of any one of embodiments 1-28, wherein the lymphoma is a lymphoma.

実施形態30.前記癌を検出することが、癌のステージを決定すること、癌の進行を決定すること、癌の種類を決定すること、癌の起源組織を決定すること、またはそれらの組み合わせを含む、実施形態1~29のいずれか1つの方法。 Embodiment 30. Embodiments wherein said detecting cancer comprises determining the stage of the cancer, determining the progression of the cancer, determining the type of cancer, determining the tissue of origin of the cancer, or combinations thereof The method of any one of 1-29.

実施形態31.前記検出された癌に基づいて処置を選択することをさらに含む、実施形態1~30のいずれか1つの方法。 Embodiment 31. 31. The method of any one of embodiments 1-30, further comprising selecting treatment based on said detected cancer.

実施形態32.前記処置が、外科的切除、放射線療法、または抗癌剤の投与を含む、実施形態31の方法。 Embodiment 32. 32. The method of embodiment 31, wherein said treatment comprises surgical resection, radiation therapy, or administration of anti-cancer agents.

実施形態33.前記選択された処置で前記対象を処置することをさらに含む、実施形態31または32の方法。 Embodiment 33. 33. The method of embodiment 31 or 32, further comprising treating said subject with said selected treatment.

実施形態34.サンプル中の複数の標的無細胞RNA(cfRNA)分子を測定する方法であって、前記方法は、
(a)前記複数の標的cfRNA分子またはそのcDNA分子を濃縮して、ポリヌクレオチドの濃縮サンプルを生成すること;および
(b)前記濃縮サンプルの前記ポリヌクレオチドまたはその増幅産物をシーケンシングすること
を含み、
前記複数の標的cfRNA分子は、表11の1つ以上の転写産物から選択される、方法。
Embodiment 34. A method of measuring a plurality of target cell-free RNA (cfRNA) molecules in a sample, said method comprising:
(a) enriching said plurality of target cfRNA molecules or cDNA molecules thereof to produce an enriched sample of polynucleotides; and (b) sequencing said polynucleotides or amplification products thereof of said enriched sample. ,
The method, wherein said plurality of target cfRNA molecules is selected from one or more transcripts of Table 11.

実施形態35.前記複数の標的cfRNA分子が、表8および表12~15のうちの1つ以上から選択される、実施形態34の方法。 Embodiment 35. 35. The method of embodiment 34, wherein said plurality of target cfRNA molecules are selected from one or more of Table 8 and Tables 12-15.

実施形態36.前記複数の標的cfRNA分子が表8から選択される、実施形態34の方法。 Embodiment 36. 35. The method of embodiment 34, wherein said plurality of target cfRNA molecules is selected from Table 8.

実施形態37.前記複数の標的cfRNA分子が表14から選択される、実施形態34の方法。 Embodiment 37. 35. The method of embodiment 34, wherein said plurality of target cfRNA molecules is selected from Table 14.

実施形態38.前記複数の標的cfRNA分子が、表8および表11~14のうちの1つ以上に記載された少なくとも5、10、15または20個の遺伝子の転写産物から選択される、実施形態34の方法。 Embodiment 38. 35. The method of embodiment 34, wherein said plurality of target cfRNA molecules are selected from transcripts of at least 5, 10, 15 or 20 genes listed in one or more of Tables 8 and Tables 11-14.

実施形態39.実施形態1~38のいずれか1つの方法における1つ以上のステップを実装するためのコンピュータシステム。 Embodiment 39. A computer system for implementing one or more steps in the method of any one of embodiments 1-38.

実施形態40.実施形態1~38のいずれか1つの方法における1つ以上のステップを実装するためのコンピュータ可読命令を格納した、非一時的なコンピュータ可読媒体。 Embodiment 40. A non-transitory computer-readable medium storing computer-readable instructions for implementing one or more steps in the method of any one of embodiments 1-38.

本明細書に記載された実施例および実施形態は、例示を目的とするものであり、当業者には、それを考慮したさまざまな修正または変更が示唆され、本願の精神および範囲、ならびに添付の特許請求の範囲に含まれることが理解される。 The examples and embodiments described herein are for the purpose of illustration, and various modifications or alterations in light thereof will be suggested to those skilled in the art, leaving the spirit and scope of the present application as well as the attached appendix. It is understood to be included in the claims.

実施例1:癌患者の血漿中の組織特異的RNAの検出
無細胞RNA(cfRNA)は癌検出のための有望な分析物であるが、cfRNAの包括的評価は不足している。血漿中の腫瘍由来RNAの特徴を明らかにするために、循環無細胞ゲノムアトラス(Circulating Cell-free Genome Atlas(CCGA))サブスタディから探索的分析を行い、癌の有無にかかわらず参加者におけるcfRNA発現を調べた。この分析は、一般集団およびCCGAにおける発生率が高い乳癌、肺癌および結腸直腸癌に焦点を当てた。
Example 1 Detection of Tissue-Specific RNA in Plasma of Cancer Patients Cell-free RNA (cfRNA) is a promising analyte for cancer detection, but a comprehensive evaluation of cfRNA is lacking. To characterize tumor-derived RNA in plasma, an exploratory analysis from the Circulating Cell-free Genome Atlas (CCGA) substudy was performed to identify cfRNA in participants with and without cancer. Expression was examined. This analysis focused on breast, lung and colorectal cancers with high incidence in the general population and CCGA.

CCGA訓練セットから210人の参加者を選択した(Klein et al.,ASCO,2018年)。合計98人の参加者が採血時にステージIIIの癌と診断された(乳癌(患者47人)、肺癌(患者32人)、結腸直腸癌(患者15人)、および肛門直腸癌(患者4人))。ステージIIIのサンプルは、血液中のシグナルを最大化し、潜在的な二次転移からの交絡シグナルを回避するために選択された。癌群と頻度年齢がマッチした非癌参加者112人も含まれていた。各参加者について、バフィーコート、cfRNA、および腫瘍組織生検のFFPEから全トランスクリプトームライブラリが作成された。 We selected 210 participants from the CCGA training set (Klein et al., ASCO, 2018). A total of 98 participants were diagnosed with stage III cancer at the time of blood draw: breast cancer (47 patients), lung cancer (32 patients), colorectal cancer (15 patients), and anorectal cancer (4 patients). ). Stage III samples were chosen to maximize the signal in the blood and avoid confounding signals from potential secondary metastases. Also included were 112 non-cancer participants who were age-matched to the cancer group. For each participant, a whole transcriptome library was generated from FFPE of buffy coat, cfRNA, and tumor tissue biopsies.

参加者の血漿から核酸を抽出し、サンプルをDNase処理して無細胞DNA(cfDNA)およびゲノムDNAを除去し、ランダムヘキサマープライマーを使用して逆転写を実行して、各研究参加者の全トランスクリプトームをキャプチャした。得られたcDNAはDNAライブラリに変換され、増幅され、リボソーム、ミトコンドリア、およびグロビンなどの血液関連転写産物から生じる豊富な配列が除去された。得られた全トランスクリプトームRNA-seqライブラリは、サンプルあたり約750Mペアエンドリードの深さでシーケンシングされ、サンプルごとに各遺伝子のUMI-collapsedカウントを生成するカスタムバイオインフォマティクスパイプラインを用いて分析された。利用可能な場合、これと同じ手順を使用して、マッチするバフィーコートおよび組織RNAからRNA-seqライブラリを作成および分析した。残留DNAコンタミネーションが存在するため、すべての下流分析はストリクトRNAリード(strict RNA reads)の使用に依存した。この例では、少なくとも1つのリードがエクソン-エクソン接合部にオーバーラップするリードペアとして定義した。図11は、エンド・ツー・エンドのワークフローの概要を示す。表9は、参加者サンプルの概要を示している: Nucleic acids were extracted from participant plasma, samples were DNase treated to remove cell-free DNA (cfDNA) and genomic DNA, reverse transcription was performed using random hexamer primers, and total captured the transcriptome. The resulting cDNA was converted into a DNA library and amplified to remove abundant sequences arising from blood-associated transcripts such as ribosomes, mitochondria, and globin. The resulting whole-transcriptome RNA-seq library was sequenced at a depth of approximately 750M paired-end reads per sample and analyzed using a custom bioinformatics pipeline that generated UMI-collapsed counts for each gene per sample. Ta. When available, RNA-seq libraries were generated and analyzed from matched buffy coat and tissue RNA using this same procedure. Due to the presence of residual DNA contamination, all downstream analyzes relied on the use of strict RNA reads. In this example, we defined read pairs in which at least one read overlapped an exon-exon junction. FIG. 11 shows an overview of the end-to-end workflow. Table 9 shows an overview of the participant sample:

Figure 2021257729000016
Figure 2021257729000016

データをTCGAからのRNAサンプルと比較した(図12A)。CCGA腫瘍組織RNA-seqデータをTCGA腫瘍組織RNA-seqデータから得られた主成分に投影したところ、CCGA腫瘍組織サンプルは癌の種類によって分離可能であった(図12B)。これらの結果は、CCGA腫瘍とTCGA腫瘍の発現プロファイルが、サンプル採取/ハンドリング/ライブラリ調製の違いにもかかわらず、非常に類似していることを示唆し、分析アプローチを検証するものである。CCGAコホートからの癌cfRNAサンプルをTCGA腫瘍組織RNA-seqデータから得られた主成分に投影したところ、癌の種類によるサンプルの分離は示されず(図12C)、癌の種類がcfRNAの主な変動要因ではないことが示唆された。 Data were compared to RNA samples from TCGA (Fig. 12A). Projecting the CCGA tumor tissue RNA-seq data onto the principal components derived from the TCGA tumor tissue RNA-seq data, the CCGA tumor tissue samples were separable by cancer type (FIG. 12B). These results suggest that the expression profiles of CCGA and TCGA tumors are very similar despite differences in sample collection/handling/library preparation and validate the analytical approach. Projection of cancer cfRNA samples from the CCGA cohort onto the principal components derived from the TCGA tumor tissue RNA-seq data showed no segregation of samples by cancer type (Fig. 12C), with cancer type being the predominant variation in cfRNA. suggested not to be a factor.

血漿中のcfRNAの大部分は健常免疫細胞に由来すると考えられている。そのためこれらの転写産物をバックグラウンドノイズとして処理し、癌シグナルの源として腫瘍由来のcfRNAに焦点を当てた。分析により、cfRNAデータ内の2つのクラスの遺伝子、「ダークチャネル」と「ダークチャネルバイオマーカー」が同定された。ダークチャネルは、非癌参加者のcfRNAでは検出されなかった遺伝子である。アノテーション付き遺伝子57,783個のうち、39,564個(68%)がダークチャネルとして同定された。ダークチャネルバイオマーカー(DCB)遺伝子は以下の3つの基準を満たした:1)非癌コホートにおける遺伝子の発現中央値がゼロであった、2)癌コホートの複数の参加者で遺伝子発現が検出された、および3)遺伝子発現が癌群で上方制御されていた。 The majority of cfRNA in plasma is believed to be derived from healthy immune cells. We therefore treated these transcripts as background noise and focused on tumor-derived cfRNA as the source of the cancer signal. The analysis identified two classes of genes within the cfRNA data, 'dark channel' and 'dark channel biomarkers'. Dark channels are genes that were not detected in cfRNA from non-cancer participants. Of the 57,783 annotated genes, 39,564 (68%) were identified as dark channels. Dark channel biomarker (DCB) genes met the following three criteria: 1) the gene had zero median expression in the non-cancer cohort, 2) gene expression was detected in multiple participants in the cancer cohort. and 3) gene expression was upregulated in the cancer group.

14個のDCB遺伝子が肺癌について同定された:SLC34A2、GABRG1、ROS1、AGR2、GNAT3、SFTPA2、MUC5B、SFTA3、SMIM22、CXCL17、BPIFA1、WFDC2、NKX2-1、およびGGTLC1である(表2参照)。乳癌については10個のDCB遺伝子が同定された:RNU1-1、CSN1S1、FABP7、OPN1SW、SCGB2A2、LALBA、CASP14、KLK5、WFDC2、およびVTCN1である(表3参照)。大腸癌については、DCB遺伝子は同定されなかった。 Fourteen DCB genes have been identified for lung cancer: SLC34A2, GABRG1, ROS1, AGR2, GNAT3, SFTPA2, MUC5B, SFTA3, SMIM22, CXCL17, BPIFA1, WFDC2, NKX2-1, and GGTLC1 (see Table 2). Ten DCB genes were identified for breast cancer: RNU1-1, CSN1S1, FABP7, OPN1SW, SCGB2A2, LALBA, CASP14, KLK5, WFDC2, and VTCN1 (see Table 3). No DCB gene was identified for colon cancer.

DCB遺伝子はいくつかの明確な特徴を示した。まず、DCB遺伝子は組織特異的遺伝子に富んでいた(図13)。57,783個のアノテーション付き遺伝子のうち、0.3%が肺特異的、0.2%が***特異的であった。対照的に、肺DCB遺伝子の50%が肺特異的であり、***DCB遺伝子の44%が***特異的であった(protein atlasデータベースによる定義(Uhlen et al.,Science,2015年))。 The DCB gene exhibited several distinct features. First, DCB genes were enriched in tissue-specific genes (Fig. 13). Of the 57,783 annotated genes, 0.3% were lung-specific and 0.2% were breast-specific. In contrast, 50% of lung DCB genes were lung-specific and 44% of breast DCB genes were breast-specific (as defined by the protein atlas database (Uhlen et al., Science, 2015)).

さらに、いくつかのDCB遺伝子は、特定の癌サブタイプでのみ検出されるサブタイプ特異的バイオマーカーであった(図14Aおよび14B)。FABP7はトリプルネガティブ乳癌(TNBC)サンプルでのみ検出された。逆に、SCGB2A2はTNBCでは検出されなかったが、HER2+およびHR+/HER-乳癌サンプルでは検出された。SLC34A2、ROS1、SFTPA2およびCXCL17遺伝子は肺腺癌患者サンプルのcfRNAで検出されたが、扁平上皮癌患者サンプルでは検出されなかった。これらのサブタイプ特異的遺伝子はまた、同じ臓器に由来する他のサブタイプの癌と比べて、腫瘍組織で高い発現を示した。 In addition, several DCB genes were subtype-specific biomarkers detected only in certain cancer subtypes (Figures 14A and 14B). FABP7 was detected only in triple-negative breast cancer (TNBC) samples. Conversely, SCGB2A2 was not detected in TNBC, but was detected in HER2+ and HR+/HER− breast cancer samples. SLC34A2, ROS1, SFTPA2 and CXCL17 genes were detected in cfRNA of lung adenocarcinoma patient samples, but not in squamous cell carcinoma patient samples. These subtype-specific genes also showed higher expression in tumor tissue compared to other subtypes of cancer derived from the same organ.

血液中の腫瘍関連転写産物の供給源を決定するために、ダークチャネルバイオマーカー遺伝子のcfRNAと腫瘍組織RNAとの一致を評価した。cfRNAと腫瘍組織発現の間に高い一致が観察された(図15A)。腫瘍組織で検出されなかった遺伝子は、マッチcfRNAサンプルで検出される可能性は低く、腫瘍組織で検出された遺伝子は、マッチcfRNAサンプルで検出される可能性が高かった。さらに、ある患者のcfDNA腫瘍フラクションとマッチ腫瘍組織における遺伝子発現の積として測定された腫瘍コンテントは、乳癌患者のcfRNAにおけるDCB遺伝子の検出可能性の強力な予測因子であった(図15B)。 To determine the source of tumor-associated transcripts in blood, the concordance of dark channel biomarker gene cfRNA with tumor tissue RNA was assessed. A high concordance was observed between cfRNA and tumor tissue expression (Fig. 15A). Genes that were not detected in tumor tissue were less likely to be detected in matched cfRNA samples, and genes that were detected in tumor tissue were more likely to be detected in matched cfRNA samples. Furthermore, tumor content, measured as the product of gene expression in a patient's cfDNA tumor fraction and matched tumor tissue, was a strong predictor of detectability of the DCB gene in breast cancer patients' cfRNA (FIG. 15B).

ダークチャネルバイオマーカー(DCB)は、非癌対象のcfRNAには見られない転写産物であり、癌患者において高いシグナル対ノイズ比を示す可能性を示した。DCBシグナルは腫瘍コンテント(血液中の腫瘍フラクションと組織におけるRNA発現量の積として測定)と相関していた。cfRNAのDCBは、癌参加者において組織特異的およびサブタイプ特異的に同定された。高い腫瘍組織発現がDCBシグナルの増幅につながり、cfDNA腫瘍フラクションが低い患者での癌の検出を可能にする場合が観察された。総合すると、これらのデータは、組織特異的転写産物は血液ベースの複数の癌の検出に使用できる可能性があることを示唆している。 Dark channel biomarkers (DCBs), transcripts not found in cfRNA in non-cancer subjects, have shown the potential to exhibit high signal-to-noise ratios in cancer patients. DCB signal correlated with tumor content (measured as the product of tumor fraction in blood and RNA expression levels in tissue). DCB of cfRNA was identified tissue- and subtype-specifically in cancer participants. A case was observed where high tumor tissue expression leads to amplification of the DCB signal, allowing detection of cancer in patients with low cfDNA tumor fractions. Taken together, these data suggest that tissue-specific transcripts may be used for blood-based detection of multiple cancers.

実施例2;異種サンプルにおけるバイオマーカーの同定 Example 2; Identification of biomarkers in heterogeneous samples

標準的な差次的発現(DE)分析を用いた異種サンプルのバイオマーカー探索において、偽陽性の2つの一般的な原因を観察した。第一に、遺伝子発現は、対照群と癌群の両方において、遺伝的不均一性または遺伝子増幅の脱落に起因する二峰性分布に従う。第二に、1つの影響力のある外れ値が、一般化線形モデル(GLM)の傾きおよびp値を増大させた。 We observed two common sources of false positives in biomarker discovery of heterogeneous samples using standard differential expression (DE) analysis. First, gene expression follows a bimodal distribution due to genetic heterogeneity or loss of gene amplification in both control and cancer groups. Second, one influential outlier increased the generalized linear model (GLM) slope and p-value.

ヘテロDEと呼ばれる、組織発現に基づくcfRNAのような、異質性の高いサンプルにおける差次的発現遺伝子を同定する方法が開発された。ヘテロDEモデルは、負の二項一般化線形モデル(NB-GLM)を使用する。偽陽性を減らすために、ヘテロDEは以下の2つの追加機能を有する:(1)非癌群の遺伝子発現が、遺伝的不均一性または遺伝子増幅の脱落による二峰性分布に従うかどうかをチェックする;および(2)1つの外れ値サンプルだけがNB-GLMのp値に影響を与えているかどうかをチェックする。外れ値サンプルは、クックの距離を用いて同定される。NB-GLMは、最大のクックの距離を有するサンプルなしで2回目に実行される。 A method was developed to identify differentially expressed genes in highly heterogeneous samples, such as cfRNA, based on tissue expression, called heterogeneous DE. The heteroDE model uses the negative binomial generalized linear model (NB-GLM). To reduce false positives, hetero-DE has two additional functions: (1) check whether gene expression in the non-cancer group follows a bimodal distribution due to genetic heterogeneity or dropout of gene amplification; and (2) check if only one outlier sample affects the NB-GLM p-value. Outlier samples are identified using Cook's distance. NB-GLM is run a second time without the sample with the largest Cook's distance.

従来の差次的発現(DE)法とは対照的に、ヘテロDEは腫瘍コンテントをNG-GLMの共変量として使用する。非癌サンプルの腫瘍コンテントはゼロに設定した。cfRNA腫瘍バイオマーカー遺伝子の仮説は、組織内での遺伝子発現が高く、cfDNAにおける腫瘍フラクションが大きいほど、cfRNA内でその遺伝子が検出される可能性が高くなるというものであった。この方法を乳癌サンプルに適用したところ、以下の9つのcfRNAバイオマーカーが同定された:TRGV10、SCGB2A2、CASP14、FABP7、CRABP2、VGLL1、SERPINB5、TFF1、およびAC007563.5(表4参照)。これらのバイオマーカーのうち3つ(FABP7、SCGB2A2、CASP14)は、DCB遺伝子として同定された遺伝子と重複する。 In contrast to conventional differential expression (DE) methods, heterogeneous DE uses tumor content as a covariate for NG-GLM. Tumor content of non-cancerous samples was set to zero. The hypothesis for cfRNA tumor biomarker genes was that the higher the gene expression in the tissue and the larger the tumor fraction in cfDNA, the more likely it was to be detected in cfRNA. When this method was applied to breast cancer samples, nine cfRNA biomarkers were identified: TRGV10, SCGB2A2, CASP14, FABP7, CRABP2, VGLL1, SERPINB5, TFF1, and AC007563.5 (see Table 4). Three of these biomarkers (FABP7, SCGB2A2, CASP14) overlap with genes identified as DCB genes.

ヘテロDEに従ったサンプル処理およびパラメータ決定を示すワークフローの例を図19に示す。組織サンプルの不足のため、非癌対象の腫瘍コンテントはゼロに制限された。ワークフローの実装例は以下の通りである:

Figure 2021257729000017
An example workflow showing sample processing and parameter determination according to heteroDE is shown in FIG. Tumor content in non-cancer subjects was limited to zero due to lack of tissue samples. An example workflow implementation is as follows:
Figure 2021257729000017

情報ゲイン法を用いた特徴選択も試験された。情報ゲイン法とは、二値化されたcfRNA遺伝子発現と癌/非癌ラベルとの間の相互情報量が高い遺伝子を選択する方法である。遺伝子発現RPM行列はバイナリ行列に変換された。その遺伝子がRPM>0であった場合は1に変換された。その遺伝子がRPM=0であった場合は0に設定された。情報ゲインは、バイナリ発現値を用いて、癌の種類(例えば、肺癌)と非癌ラベルを指定して各遺伝子について算出した。乳癌群に対する非癌群は、非癌群の女性対象のみを選択し、性別のバランスをとった。最も情報ゲインの高い上位100遺伝子をモデル化のための特徴として選択した。各遺伝子の値はモデリングプロセスでバイナリ値に変換された。乳癌対非癌、および結腸直腸癌対非癌について、これらの手順を繰り返した。肺癌に関して最も情報ゲインの高い上位30遺伝子を表5に示し、乳癌に関して最も情報ゲインの高い上位30遺伝子を表6に示す。 Feature selection using the information gain method was also tested. The information gain method is a method of selecting genes with high mutual information between binarized cfRNA gene expression and cancer/non-cancer labels. Gene expression RPM matrices were converted to binary matrices. If the gene had RPM>0, it was converted to 1. If the gene had RPM=0, it was set to 0. Information gain was calculated for each gene using binary expression values and specifying cancer type (eg, lung cancer) and non-cancer label. The non-cancer versus breast cancer group selected only female subjects from the non-cancer group to balance gender. The top 100 genes with the highest information gain were selected as features for modeling. Each gene value was converted to a binary value in the modeling process. These procedures were repeated for breast vs. non-cancer and colorectal vs. non-cancer. The top 30 genes with the highest information gain for lung cancer are shown in Table 5 and the top 30 genes with the highest information gain for breast cancer are shown in Table 6.

別の実施形態において、特徴選択を癌組織サンプルから実行し、癌組織サンプルで発現しているが非癌参加者では発現していない遺伝子を同定した。実施例1で上述したようにライブラリを調製し、シーケンシングした。各癌組織サンプルについて、ダークチャネルから癌組織(組織RPM>10)で比較的高いレベルで発現している遺伝子を同定した。これらの遺伝子は「組織ブライトチャネル遺伝子」として分類された。同定された組織ブライトチャネル遺伝子の上位15個を表7に示す。 In another embodiment, feature selection was performed from cancer tissue samples to identify genes that were expressed in cancer tissue samples but not in non-cancer participants. Libraries were prepared and sequenced as described above in Example 1. For each cancer tissue sample, dark channel identified genes that were expressed at relatively high levels in cancer tissue (tissue RPM>10). These genes were classified as "tissue bright channel genes". The top 15 identified tissue bright channel genes are shown in Table 7.

実施例3:別のコホートにおけるDCBの検証
CCGAコホートで同定されたDCBを、市販業者(Discovery Life Sciences社)から入手した乳癌サンプル(38)と肺癌サンプル(18)の直交セットで検証することにした。疾患の進行全体にわたるDCBの保有率を評価するためにステージI~IVの患者が選択され、癌のない患者におけるDCB発現の対照として、年齢がマッチする38の非癌サンプルを含めた。感度を向上させ、シーケンシングの必要性を減らすために、CCGAコホートで同定された23個のDCBを選択する標的化濃縮アプローチを開発した。また、非癌血漿中に通常存在する33個の陽性対照遺伝子を濃縮した。非癌サンプルの大部分はDCB転写産物を含まないため、これらの転写産物は濃縮ステップでキャリア材料として機能する。得られた標的化RNA-seqライブラリはシーケンシングされ、100Mペアエンドリード/サンプルの深さまでサブサンプリングされ、標的遺伝子とオフターゲット遺伝子の両方についてストリクトRNAリードの数が定量化された。全トランスクリプトームアッセイと比較すると、標的化アプローチにより、標的化cfRNA転写産物の変換効率が2~3倍向上することがわかった。
Example 3 Validation of DCB in Separate Cohorts DCB identified in the CCGA cohort was validated in an orthogonal set of breast (38) and lung (18) cancer samples obtained from a commercial vendor (Discovery Life Sciences). did. Stage I-IV patients were selected to assess DCB prevalence throughout disease progression, and 38 age-matched non-cancer samples were included as controls for DCB expression in cancer-free patients. To improve sensitivity and reduce the need for sequencing, we developed a targeted enrichment approach that selected 23 DCBs identified in the CCGA cohort. We also enriched 33 positive control genes normally present in non-cancer plasma. Since the majority of non-cancer samples do not contain DCB transcripts, these transcripts serve as carrier material in the enrichment step. The resulting targeted RNA-seq library was sequenced, subsampled to a depth of 100M paired-end reads/sample, and the number of strict RNA reads for both target and off-target genes was quantified. We found that the targeted approach improved the conversion efficiency of targeted cfRNA transcripts by 2-3 fold when compared to the whole transcriptome assay.

我々のCCGAコホートで同定された23個のDCBのうち、1個(CRABP2)を除くすべてのDCBは、非癌群で発現中央値(単位RPM)が0であった。我々のパネルの19個のDCBは、検証コホートの少なくとも1つの癌サンプルで発現され(2つ以上のユニーク断片)、これらのDCBのうち16個は、非癌サンプルと比較して、少なくとも1つの癌の種類で差次的に発現された。アッセイ効率とステージが向上するにつれて、いくつかの組織特異的マーカーが乳癌と肺癌の両方に存在することに気づいたが、それらの発現は2つの群間で依然として差があった。乳癌におけるSCGB2A2、肺癌におけるROS1、SFTA3およびSFTPA2のように、1つ癌の種類でのみ発現するDCBもいくつかある。この検証コホートで観察されたすべてのDCBについて、癌サンプルにおけるDCB発現のレベルはステージとともに上昇し、我々のコホートではステージIVのサンプルで最も高い発現がみられ、癌の特異的マーカーとしてのこれらの特徴の妥当性を支持した。このような傾向にもかかわらず、コホート内の早期癌においてもDCBの発現が観察され、DCBを濃縮するアプローチを用いて早期癌を検出する機会があることが示唆された。例示的な結果を図16A~Dに示す。図16A~Dは、Y軸に沿ってリードカウント数を示す。 Of the 23 DCBs identified in our CCGA cohort, all but one (CRABP2) had a median expression (in RPM) of 0 in the non-cancer group. The 19 DCBs in our panel were expressed (2 or more unique fragments) in at least one cancer sample in the validation cohort, and 16 of these DCBs expressed at least one Differentially expressed in cancer types. As assay efficiency and stage improved, we noticed that some tissue-specific markers were present in both breast and lung cancer, but their expression still differed between the two groups. There are also some DCBs that are expressed in only one cancer type, such as SCGB2A2 in breast cancer, ROS1, SFTA3 and SFTPA2 in lung cancer. For all DCBs observed in this validation cohort, the level of DCB expression in cancer samples increased with stage, with the highest expression seen in stage IV samples in our cohort, suggesting that these as specific markers of cancer. The validity of the features was supported. Despite this trend, DCB expression was also observed in early-stage cancers within the cohort, suggesting that there is an opportunity to detect early-stage cancers using DCB-enriching approaches. Exemplary results are shown in Figures 16A-D. Figures 16A-D show read counts along the Y-axis.

分類結果
ダークチャネルバイオマーカー(DCB)、ヘテロDE、および情報ゲイン(IG)など、さまざまな特徴選択法を用いて、leave-one-out(LOO)および5分割交差検証分類を適用した。例示的なワークフローを図17A~Bに示す。ヘテロDEはマッチ腫瘍組織を利用するため、肺組織のサンプル数が限られているため、この特徴選択法は肺癌/非癌分類には適用されなかった。全体として、乳癌/非癌分類では、5分割交差検証と比較してLOOの方が有意に優れた分類性能を示したが、これは各訓練セットのサンプルサイズが小さいため、5分割分類では乳癌分類器の訓練が不十分であることを示唆している。肺癌/非癌分類器ではDCBが最も優れた性能(特異度98%における感度:0.2±0.037)を示し、乳癌/非癌分類器ではヘテロDEが最も優れた性能(特異度98%における感度:0.303±0.046)を示した(表10)。
Classification Results Leave-one-out (LOO) and 5-fold cross-validation classification were applied using various feature selection methods, including dark channel biomarkers (DCB), heterogeneous DE, and information gain (IG). An exemplary workflow is shown in Figures 17A-B. This feature selection method was not applied to lung cancer/non-cancer classification due to the limited number of lung tissue samples since heteroDE utilizes matched tumor tissue. Overall, LOO showed significantly better classification performance compared to 5-fold cross-validation for breast cancer/non-cancer classification, but this was due to the small sample size of each training set, and the 5-fold classification for breast cancer This suggests that the classifier is under-trained. DCB showed the best performance (sensitivity at 98% specificity: 0.2 ± 0.037) for the lung cancer/non-cancer classifier, and heteroDE performed the best for the breast cancer/non-cancer classifier (specificity 98%). % sensitivity: 0.303±0.046) (Table 10).

Figure 2021257729000018
Figure 2021257729000018

図18A~Cには、例示的な結果もプロットされており、これはleave-one-out交差検証を用いて作成されたものである。図18Aは、ヘテロDE特徴選択法およびランダムフォレスト分類器を使用した、乳癌対非癌についてのleave-one-out(LOO)交差検証分類からの受信者動作特性(ROC)プロットおよび変数重要度プロットを示す。入力データは、DESeq2 Rパッケージのサイズ係数正規化(estimateSizeFactorsを使用)関数を使用して正規化された遺伝子あたりのカウントであった。表10に示すように、95%での感度は0.394+/-0.049であった。 Exemplary results are also plotted in Figures 18A-C, which were generated using leave-one-out cross-validation. FIG. 18A is a receiver operating characteristic (ROC) plot and variable importance plot from leave-one-out (LOO) cross-validated classification for breast cancer vs. no cancer using the heterogeneous DE feature selection method and random forest classifier. indicates Input data were counts per gene normalized using the size factor normalization (using estimateSizeFactors) function of the DESeq2 R package. As shown in Table 10, the sensitivity at 95% was 0.394+/-0.049.

図18Bは、ダークチャネル特徴選択法およびランダムフォレスト分類器を使用した、肺対非癌ラベルについてのleave-one-out(LOO)交差検証分類からのROCプロットを示す。入力データは、遺伝子あたりのカウントを正規化したもので、単位はリード・パー・ミリオン(reads per million(RPM))であった。表10に示すように、95%特異性での感度は0.3+/-0.042であった。 FIG. 18B shows ROC plots from leave-one-out (LOO) cross-validated classification for lung vs. non-cancer labels using the dark channel feature selection method and random forest classifier. Input data were normalized counts per gene in units of reads per million (RPM). As shown in Table 10, the sensitivity at 95% specificity was 0.3+/-0.042.

図18Cは、ダークチャネル特徴選択法およびランダムフォレスト分類器を使用した、***対非癌ラベルについてのleave-one-out(LOO)相互検証分類からのROCプロットおよび変数重要度プロットを示す。入力データは、遺伝子あたりのカウントを正規化したもので、単位はリード・パー・ミリオン(reads per million(RPM))であった。表10に示すように、95%特異性での感度は0.212+/-0.041であった。 FIG. 18C shows ROC plots and variable importance plots from leave-one-out (LOO) cross-validation classification for breast versus non-cancer labels using the dark channel feature selection method and random forest classifier. Input data were normalized counts per gene in units of reads per million (RPM). As shown in Table 10, the sensitivity at 95% specificity was 0.212+/-0.041.

実施例5:
シーケンシングデータ処理
Example 5:
Sequencing data processing

生のリード(Raw reads)は、STARバージョン2.5.3aを用いて、すべての転写産物を含むgencode v19プライマリアセンブリにアライメントされた。ゲノムのアラインメント位置と非ランダムUMI配列に基づいて、重複した配列リードが検出され、削除された。ペアエンドリードの大部分は、予想される配列と正確にマッチするUMI配列を有していた。リードのサブセットはUMI配列中にエラーを含んでおり、ヒューリスティックエラー補正が適用された。UMIが予想されるUMIからハミング距離1以内の場合、そのUMI配列に割り当てられた。ハミング距離が1を超える場合、または複数の既知配列がハミング距離1以内にある場合、UMIエラーのあるリードは破棄された。アライメント位置を共有するリードのセットと補正されたUMIは、メンバーリードのマルチプル・シーケンス・アライメントによってエラー補正され、単一のコンセンサス配列/アライメントが生成された。リードアライメントを、gencode v19でアノテーション付き転写産物と比較した。DNAコンタミネーションリードに起因するフォールスカウント(false counts)を除去するために、アノテーション付きエクソン-エクソン接合部にまたがるリードのみをカウントした。 Raw reads were aligned to the gencode v19 primary assembly containing all transcripts using STAR version 2.5.3a. Duplicate sequence reads were detected and deleted based on the alignment positions of the genome and non-random UMI sequences. Most of the paired-end reads had UMI sequences that exactly matched the expected sequences. A subset of reads contained errors in the UMI sequence and heuristic error correction was applied. If a UMI was within a Hamming distance of 1 from the expected UMI, it was assigned to that UMI sequence. Reads with UMI errors were discarded if the Hamming distance was greater than 1 or if multiple known sequences were within a Hamming distance of 1. The set of reads sharing alignment positions and the corrected UMI were error corrected by multiple sequence alignment of member reads to generate a single consensus sequence/alignment. Read alignments were compared with transcripts annotated with gencode v19. Only reads spanning annotated exon-exon junctions were counted to eliminate false counts due to DNA-contamination reads.

サンプル採取 sample collection

全血はStreck Cell-free DNA BCTチューブに採取され、血漿分離前に出荷され、周囲温度で保存された。全血をスイングバケットローターで1600g、4℃で10分間遠心し、血漿を分離した。血漿層を別のチューブに移し、15000g、4℃で12分間遠心し、細胞性コンタミナントをさらに除去した。2回遠心した血漿は-80℃で保存し、凍結沈殿の形成を避けるため、抽出前に室温で解凍した。 Whole blood was collected in Streck Cell-free DNA BCT tubes, shipped and stored at ambient temperature prior to plasma separation. Whole blood was centrifuged in a swinging bucket rotor at 1600 g for 10 minutes at 4° C. to separate plasma. The plasma layer was transferred to another tube and centrifuged at 15000g, 4°C for 12 minutes to further remove cellular contaminants. Plasma centrifuged twice was stored at −80° C. and thawed at room temperature prior to extraction to avoid the formation of cryoprecipitates.

サンプルの選択基準 Sample selection criteria

循環無細胞ゲノムアトラス研究(CCGA、NCT02889978)から、ステージIIIの乳癌、肺癌および結腸直腸癌サンプルのサブセットを選択した。選択した患者には、患者当たり6~8mLの未処理のグレード1~2血漿(溶血なし)を少なくとも2本用意する必要があった。さらに、選択した患者が以前の研究からのマッチcfDNAシーケンシングデータを有することを要求した。癌患者を選択したら、年齢、性別および民族が癌サンプルとマッチする同数の非癌サンプルを選択した。この基準に基づき、210のサンプルを選択した。これらのサンプルは、Rのランダム化関数を用いて14個のバッチにランダム化され、各バッチ内で癌の種類(癌サンプルと非癌サンプル)がランダムに混在するようにした。 A subset of stage III breast, lung and colorectal cancer samples were selected from the Circulating Cell-Free Genome Atlas Study (CCGA, NCT02889978). Selected patients were required to have at least two tubes of 6-8 mL of unprocessed grade 1-2 plasma (no hemolysis) per patient. In addition, we required that selected patients have matching cfDNA sequencing data from previous studies. Once cancer patients were selected, an equal number of non-cancer samples matched by age, gender and ethnicity to cancer samples were selected. Based on this criterion, 210 samples were selected. These samples were randomized into 14 batches using the randomization function of R, with a random mix of cancer types (cancer and non-cancer samples) within each batch.

サンプル処理 Sample processing

QIAamp循環核酸キット(Qiagen社、55114)の循環miRNAプロトコールを用いて、最大8mLの凍結血漿から無細胞核酸を抽出した。抽出した材料は、RNase-free DNase Set(Qiagen社、79254)を用いて製造元の指示に従ってDNase処理し、High Sensitivity RNA Fragment Analyzerキット(Agilent社、DNF-472)を用いて定量化した。逆転写とアダプターライゲーションは、TruSeq RNA Exomeキット(Illumina社、20020189)を用いて行った。得られたライブラリは、枯渇標的のカスタムセットを追加したAnyDeplete for Human rRNA and Mitochondrialキット(Tecan社、9132)を用いて、豊富な配列を除去した。 Cell-free nucleic acids were extracted from up to 8 mL of frozen plasma using the circulating miRNA protocol of the QIAamp Circulating Nucleic Acid Kit (Qiagen, 55114). Extracted material was DNase treated using the RNase-free DNase Set (Qiagen, 79254) according to the manufacturer's instructions and quantified using the High Sensitivity RNA Fragment Analyzer kit (Agilent, DNF-472). Reverse transcription and adapter ligation were performed using the TruSeq RNA Exome kit (Illumina, 20020189). The resulting library was depleted of abundant sequences using the AnyDeplete for Human rRNA and Mitochondrial kit (Tecan, 9132) supplemented with a custom set of depletion targets.

シーケンシングされたサンプルはスクリーニングされ、品質管理メトリックが低いものはその後の分析から除外された。1つのアッセイメトリックと3つのパイプラインメトリックが「レッドフラッグ」として選ばれ、メトリックの悪いサンプルを除外するために使用された。アッセイメトリックは、サンプルがシーケンシングに十分な材料を有するかどうかを測定し、パイプラインメトリックは、シーケンシングの深さ、RNA純度、およびクロスサンプルコンタミネーションであった。 Sequenced samples were screened and those with low quality control metrics were excluded from further analysis. One assay metric and three pipeline metrics were selected as 'red flags' and used to exclude samples with poor metrics. Assay metrics measured whether samples had sufficient material for sequencing, and pipeline metrics were sequencing depth, RNA purity, and cross-sample contamination.

遺伝子発現の定量化 Quantification of gene expression

データの最初の検査では、ライブラリ調製中のDNase消化ステップにもかかわらず、cfRNAサンプル中にさまざまなレベルの残留DNAが存在することが明らかになった。コンタミネーションのレベルは最小限であり(サンプルあたり6ハプロイドゲノム相当量未満)、消化前のcfDNAの量またはバッチ特有の問題とは相関していなかった。むしろ、これまでの報告と同様に、確率的なものと思われる。 Initial inspection of the data revealed varying levels of residual DNA in the cfRNA samples despite the DNase digestion step during library preparation. The level of contamination was minimal (less than 6 haploid genome equivalents per sample) and did not correlate with the amount of cfDNA prior to digestion or batch-specific issues. Rather, it appears to be probabilistic, as in previous reports.

発現の95分位点以下の遺伝子の鎖特異性として定義されるQCメトリック「95分位点鎖特異性」を使用して、各サンプルのDNAコンタミネーションレベルを評価した。UHR陽性対照サンプルは、高い95分位点鎖特異性(>0.85)を示した。cfRNAの95分位点鎖特異性の値は、広範囲(0.52~0.89)にわたって分布した。参考までに、cfDNAサンプルの95分位点鎖特異性は約0.5であり、一部のcfRNAサンプルが残留DNAからのシグナルによって支配されていることを示唆している。リード鎖の色は、NC3ではセンスリードのみであるのに対し、NC67ではセンスリードとアンチセンスリードが均等に分布していることを示している。さらに、DNAの存在から予想されるように、NC67ではイントロンとエクソンの両方にわたって豊富にカバーされている。高レベルのDNAコンタミネーションを含むサンプルにおける断片の長さの分布は、cfDNAの長さの分布(中央値~160)に類似していることを示しており、未消化のcfDNAが主要なコンタミナントであることを強く示唆している。 The DNA contamination level of each sample was assessed using the QC metric "95 quantile strand specificity", defined as the strand specificity of genes below the 95 quantile of expression. The UHR positive control sample showed high 95 quantile strand specificity (>0.85). The cfRNA 95-quartile strand specificity values were distributed over a wide range (0.52-0.89). For reference, the 95-quartile strand specificity of the cfDNA samples was approximately 0.5, suggesting that some cfRNA samples were dominated by signals from residual DNA. The color of the lead strands shows that NC3 has only sense reads, whereas NC67 has an even distribution of sense and antisense reads. Furthermore, as expected from the presence of DNA, NC67 has abundant coverage across both introns and exons. The fragment length distribution in samples containing high levels of DNA contamination showed a similarity to the cfDNA length distribution (median ~160), with undigested cfDNA being the major contaminant. It strongly suggests that

95分位点鎖特異性が0.84未満のサンプルにはフラグが付けられ、その後の分析から除外された。DNAコンタミネーションによるRNAカウントのインフレをさらに防ぐために、ここに示した遺伝子カウントは、2つのリードのうち少なくとも1つがエクソン-エクソン接合部にマッピングされるリードペアとして定義されるストリクトカウント(strict counts)を用いて生成されている。cfRNAサンプルにスパイクされたさまざまなレベルのcfDNAを使用して行われた実験では、ストリクトカウントを用いたRNAレベルの推定に変化がないことが示され、遺伝子発現の定量化および比較のためのパイロット研究サンプルにおけるストリクトカウントの使用が支持された。 Samples with 95-quantile strand specificity less than 0.84 were flagged and excluded from further analysis. To further prevent inflation of RNA counts by DNA contamination, the gene counts presented here have strict counts, defined as read pairs in which at least one of the two reads maps to an exon-exon junction. generated using Experiments performed using varying levels of cfDNA spiked into cfRNA samples showed no change in estimation of RNA levels using strict counts, providing a pilot for gene expression quantification and comparison. The use of strict counts in study samples was supported.

ダークチャネル特徴選択 Dark channel feature selection

ダークチャネル遺伝子は次の基準によって同定された:1)非癌群におけるこの遺伝子の発現中央値(RPM)は0で、この遺伝子の標準偏差は0.1RPM未満である。各癌タイプのダークチャネルバイオマーカー(DCB)は、次の基準を使用して同定された:1)特定の癌群内にその遺伝子が発現しているサンプルが少なくとも2つあり、2)2番目に発現量の高いサンプルのRPMが0.1より大きく、3)その遺伝子は、非癌群と比較して特定の癌群で差次的に発現される(肺癌の場合はp値<2e-02、乳癌の場合はp値<2e-01)。2つの群の差次的発現のp値は、edgeRパッケージによって計算された。肺癌群と非癌群の間には、FDR<0.05の遺伝子が816個ある。乳癌群と非癌群の間には、FDR<0.05の遺伝子が28個ある。結腸直腸癌群と非癌群の間には、FDR<0.05の遺伝子が4個ある。ボックスプロットおよびヒートマップでは、最も有意な差次的発現遺伝子のみを表示した(肺癌および乳癌ではFDR<2e-06、結腸直腸癌ではFDR<2e-02)。 Dark channel genes were identified by the following criteria: 1) The median expression (RPM) of this gene in the non-cancer group is 0 and the standard deviation of this gene is less than 0.1 RPM. Dark channel biomarkers (DCBs) for each cancer type were identified using the following criteria: 1) there were at least two samples with that gene expressed within a particular cancer group; 3) the gene is differentially expressed in a specific cancer group compared to the non-cancer group (p-value < 2e- 02, p-value <2e-01 for breast cancer). The p-value for differential expression of the two groups was calculated by the edgeR package. There are 816 genes with FDR<0.05 between the lung cancer and non-cancer groups. There are 28 genes with FDR<0.05 between the breast cancer and non-cancer groups. There are 4 genes with FDR<0.05 between the colorectal cancer and non-cancer groups. Boxplots and heatmaps displayed only the most significant differentially expressed genes (FDR<2e-06 in lung and breast cancers, FDR<2e-02 in colorectal cancers).

組織特異的遺伝子のアノテーションは以下のように行った。組織特異的遺伝子のアノテーションは次のように実行された。肺癌、乳癌、および結腸直腸癌の組織特異的遺伝子ファイルは、ヒトタンパク質アトラスのウェブサイト(www.proteinatlas.org/)からダウンロードされた。組織特異的遺伝子は3つのカテゴリーに分けられる:1)組織濃縮:特定の組織におけるmRNAレベルが他のすべての組織と比較して少なくとも4倍高い、2)グループ濃縮:2~5の組織のグループにおいてmRNAレベルが少なくとも4倍高い、3)組織増強:特定の組織におけるmRNAレベルが全組織の平均レベルと比較して少なくとも4倍高い。3つのカテゴリーはすべて、組織特異的遺伝子の定義に含まれていた。 Annotation of tissue-specific genes was performed as follows. Annotation of tissue-specific genes was performed as follows. Lung, breast, and colorectal cancer tissue-specific gene files were downloaded from the Human Protein Atlas website (www.proteinatlas.org/). Tissue-specific genes are divided into three categories: 1) tissue enrichment: mRNA levels in specific tissues are at least 4-fold higher than all other tissues, 2) group enrichment: groups of 2-5 tissues. 3) Tissue enhancement: mRNA levels in specific tissues are at least 4-fold higher than the average level of all tissues. All three categories were included in the definition of tissue-specific genes.

組織特異的遺伝子の濃縮を試験するために、以下のことを行った。1)フィッシャーの正確確率検定を適用して、すべてのアノテーション付きヒト遺伝子について肺DCBと肺特異的遺伝子の間の独立性を試験した。2)フィッシャーの正確確率検定を適用して、すべてのアノテーション付きヒト遺伝子について***DCBと***特異的遺伝子の間の独立性を試験した。 To test tissue-specific gene enrichment, the following was done. 1) Fisher's exact test was applied to test the independence between lung DCB and lung-specific genes for all annotated human genes. 2) Fisher's exact test was applied to test the independence between breast DCB and breast-specific genes for all annotated human genes.

実施例6:cfRNA癌バイオマーカーのパネル
正常な非癌コホートとは異なる全トランスクリプトームから肺癌および乳癌に特異的なcfRNAバイオマーカーを同定し、癌のバイナリ検出および血漿からの起源組織(TOO)の同定に有用であり得る癌サンプルのcfRNAに特異的に表される生物学的シグナルを同定することを目的として、研究が設計された。早期ステージでの検出が困難な癌のサブタイプ、すなわち、肺腺癌、HR+およびトリプルネガティブ(TNBC)乳癌に関連する遺伝子特徴を同定することに焦点が当てられた。
Example 6: Panel of cfRNA Cancer Biomarkers Identification of Lung and Breast Cancer-Specific cfRNA Biomarkers from Whole Transcriptomes Distinct from Normal Non-Cancer Cohorts, Binary Detection of Cancer and Tissue of Origin (TOO) from Plasma A study was designed with the goal of identifying biological signals specifically expressed in cfRNA in cancer samples that may be useful in identifying cancer. The focus was on identifying genetic signatures associated with cancer subtypes that are difficult to detect at early stages: lung adenocarcinoma, HR+ and triple-negative (TNBC) breast cancer.

この分析を実行するために使用されたデータには、1)CCGAおよび商用ベンダーからシーケンシングされた全トランスクリプトーム血漿データ、2)TCGAからの全トランスクリプトーム組織データ、および3)ヒトタンパク質アトラスからの遺伝子アノテーション(Uhlen et al, Science 2015年)が含まれる。ステージIIIの乳癌および肺癌サンプルのサブセットが、循環無細胞ゲノムアトラス研究(CCGA、NCT02889978)から選択され、シーケンシングされた。ステージIIIのサンプルは、潜在的な二次転移からの交絡シグナルを回避しながら血液中のシグナルを最大化するように選択された。合計で、CCGAから採取した47個の乳癌サンプル、14個の肺腺癌サンプル、および93個の非癌血漿サンプルを分析した。さらに、商用ベンダー(Conversant)から入手した全トランスクリプトームサンプルの追加セットも含めた。これには、血液中のバイオマーカーの遅いステージのシグナルを捕捉するために含まれる、ステージIVの乳癌血漿サンプル14個のセットが含まれていた。これらの血漿由来データは、どの遺伝子が健常血漿で発現し、どの遺伝子が癌血漿で差次的に発現するかを定義するために使用され、これらのサブタイプにおける癌のバイナリ検出に価値がある可能性がある。各サンプルの遺伝子発現をRPM(リード・パー・ミリオン(reads per million))正規化遺伝子特徴行列に編集した。ここで、各サンプルは列、各行は遺伝子特徴である。 The data used to perform this analysis included 1) sequenced whole-transcriptome plasma data from CCGA and commercial vendors, 2) whole-transcriptome tissue data from TCGA, and 3) human protein atlas includes gene annotations from (Uhlen et al, Science 2015). A subset of stage III breast and lung cancer samples were selected from the Circulating Cell-Free Genome Atlas Study (CCGA, NCT02889978) and sequenced. Stage III samples were chosen to maximize the signal in blood while avoiding confounding signals from potential secondary metastases. In total, 47 breast cancer samples, 14 lung adenocarcinoma samples, and 93 non-cancer plasma samples collected from CCGA were analyzed. Additionally, an additional set of whole transcriptome samples obtained from a commercial vendor (Conversant) was included. This included a set of 14 stage IV breast cancer plasma samples included to capture late stage signals of biomarkers in blood. These plasma-derived data will be used to define which genes are expressed in healthy plasma and which genes are differentially expressed in cancer plasma, and are valuable for binary detection of cancer in these subtypes. there is a possibility. Gene expression for each sample was compiled into an RPM (reads per million) normalized gene feature matrix. where each sample is a column and each row is a gene feature.

この研究には、GDCポータルからダウンロードした、TCGAコンソーシアムからの乳癌(BRCA)および肺腺癌(LUAD)組織の全トランスクリプトームデータも含まれている。これには、ステージI~IVにわたる合計533個の肺腺癌サンプルと1,102個の乳癌サンプルが含まれていた。これらのデータは、バイナリ検出のために高発現腫瘍由来遺伝子の特徴を特定するために使用された。さらに、この高次元データは、TOOに使用できる組織特異的遺伝子の特徴を同定するのに有用であった。各サンプルの遺伝子発現をRPM(リード・パー・ミリオン(reads per million))正規化遺伝子特徴行列に編集した。ここで、各サンプルは列、各行は遺伝子特徴である。 This study also includes whole transcriptome data of breast cancer (BRCA) and lung adenocarcinoma (LUAD) tissues from the TCGA consortium, downloaded from the GDC portal. This included a total of 533 lung adenocarcinoma samples and 1,102 breast cancer samples ranging from stages I-IV. These data were used to characterize highly expressed tumor-derived genes for binary detection. In addition, this high-dimensional data was useful in identifying tissue-specific gene signatures that could be used in TOO. Gene expression for each sample was compiled into an RPM (reads per million) normalized gene feature matrix. where each sample is a column and each row is a gene feature.

最後に、ヒトタンパク質アトラスのすべての遺伝子特徴を調べた。これは、癌腫瘍サンプルおよび健常組織からのさまざまなオミクス技術(トランスクリプトームおよび抗体ベース)をオープンアクセスで編集したものであり、組織コンパートメントおよび疾患のアノテーションを提供する。これらのアノテーションを用いて、診断時の腫瘍発現レベルと患者の全生存率に基づいて、その遺伝子が癌タイプ濃縮/増強であるか、疾患の予後に好ましい/好ましくないかを把握した。 Finally, we examined all gene signatures of the human protein atlas. This is an open-access compilation of various omics techniques (transcriptome and antibody-based) from cancer tumor samples and healthy tissues, providing annotation of tissue compartments and disease. These annotations were used to understand whether the gene was cancer-type enriched/enhanced or favored/disfavored for disease prognosis based on tumor expression levels at diagnosis and overall patient survival.

バイナリ検出とTOO分類の標的セットを確立するために、まず、GDCデータポータルからダウンロードしたTCGA組織発現データを用いて、バイオマーカーの可能性が高いかどうかを評価した。各遺伝子について、両コホートのサンプル間の平均遺伝子発現を計算し、コホート間のピアソン相関を算出した。一般に、TCGA組織における高い平均遺伝子発現は、CCGA血漿における高い平均遺伝子発現とほぼ相関することが明らかになった(スピアマンのrhoは乳癌で0.568、肺癌で0.509)。したがって、TCGA組織データは特徴選択に有益である可能性があると推論した。TCGA組織発現の平均が1RPMを超える遺伝子特徴を、癌由来血漿で検出可能である可能性が高く、バイナリ癌検出または起源組織検出のいずれかに有益である可能性があるものとして優先順位を付けた。アーティファクトを誘発する可能性の高い共通の転写産物(HLA、IGH、IGL、およびリボソーム遺伝子にマッピングされる転写産物)についてこれらを抽出した結果、2898個の潜在的な遺伝子特徴が得られた。 To establish a target set for binary detection and TOO classification, we first assessed whether biomarkers were likely using TCGA tissue expression data downloaded from the GDC data portal. For each gene, average gene expression between samples in both cohorts was calculated and the Pearson's correlation between cohorts was calculated. In general, high mean gene expression in TCGA tissues was found to correlate roughly with high mean gene expression in CCGA plasma (Spearman's rho 0.568 for breast cancer and 0.509 for lung cancer). Therefore, we reasoned that TCGA tissue data may be beneficial for feature selection. Gene features with mean TCGA tissue expression greater than 1 RPM were prioritized as likely to be detectable in cancer-derived plasma and potentially beneficial for either binary cancer detection or tissue-of-origin detection. Ta. These extractions for common artifact-inducing transcripts (HLA, IGH, IGL, and transcripts mapping to ribosomal genes) resulted in 2898 potential gene features.

しかし、これらの遺伝子特徴がTCGA組織で高度に発現されていたとしても、これらの遺伝子特徴が血漿中でどの程度広く発現されているかは不明であった。血漿と比較した組織における平均RPMのプロットを図22(乳癌)および図23(肺癌)に示す。図21は、、癌組織サンプルで高レベルに発現し、血漿では転写産物がほとんどまたは全く検出できない遺伝子についての結果の例を提供する。遺伝子特徴の選択も、CCGAの血漿中の発現から得られた情報を活用して実施された。遺伝子発現の特徴を、CCGA血漿サンプルで検出されたか検出されなかったかでバイナリ化した。検出されたとは、0.005リード・パー・ミリオン(RPM)以上の発現である。次に、すべての癌血漿とすべての非癌血漿の観察に基づいて、各遺伝子の血漿対数オッズ比(LOR)を計算した。これは、ある遺伝子が非癌サンプルに存在する尤度に対する、その遺伝子が癌サンプルに存在する尤度を定量化したものである。LOR>0は、非癌症例よりも癌症例で遺伝子が検出される尤度が高いことを示し、LOR<0は、癌症例よりも非癌症例で遺伝子が検出される尤度が高いことを示す。LOR>0.1を有する血漿中の最も有益な遺伝子を選択した結果、281個の遺伝子特徴が得られた。cfRNAバイオマーカーのLORのプロット例を図24に示す。 However, even if these gene signatures were highly expressed in TCGA tissues, it was unclear how widely these gene signatures were expressed in plasma. Plots of mean RPM in tissue compared to plasma are shown in Figure 22 (breast cancer) and Figure 23 (lung cancer). FIG. 21 provides example results for genes that are highly expressed in cancer tissue samples and have little or no detectable transcripts in plasma. Gene signature selection was also performed with the help of information obtained from plasma expression of CCGA. Gene expression signatures were binarized as detected or not detected in CCGA plasma samples. Detected is expression greater than or equal to 0.005 reads per million (RPM). The plasma log odds ratio (LOR) for each gene was then calculated based on the observations of all cancer plasma and all non-cancer plasma. It quantifies the likelihood that a gene is present in cancer samples relative to the likelihood that the gene is present in non-cancer samples. LOR>0 indicates that the gene is more likely to be detected in cancer cases than in non-cancer cases, and LOR<0 indicates that the gene is more likely to be detected in non-cancer cases than in cancer cases. show. Selecting the most informative genes in plasma with LOR>0.1 resulted in 281 gene features. An example plot of LOR for cfRNA biomarkers is shown in FIG.

さらに、どの遺伝子特徴が特にTOO分類に有用であるかを評価することに着手した。cfRNAのCCGAデータセットは200サンプル未満に限られているため、TCGA腫瘍遺伝子行列を使用し、再帰的特徴除去アルゴリズムを実行して、肺腺癌、HR+乳癌、およびTNBC乳癌を区別するために重要な遺伝子特徴を同定することにした。ランダムフォレスト・マルチクラスモデルを使用して、すべての遺伝子特徴について10分割交差検証により上位K遺伝子を再帰的に選択した。分割間の精度を最適化することで、繰り返しにわたって特徴が除去される。交差検証されたモデルは、750個の遺伝子特徴を使用した場合に96.7%の精度でTCGAサンプルを分類するため、これらの上位750個のバイオマーカーが組織内のサブタイプ分類に重要であると同定された。 In addition, we set out to evaluate which gene features are particularly useful for TOO classification. Since the CCGA dataset for cfRNA is limited to less than 200 samples, it is important to use the TCGA tumor gene matrix and perform a recursive feature removal algorithm to distinguish between lung adenocarcinoma, HR+ breast cancer, and TNBC breast cancer. We decided to identify specific genetic features. A random forest multiclass model was used to recursively select the top K genes by 10-fold cross-validation for all gene features. Features are removed across iterations by optimizing the accuracy between splits. These top 750 biomarkers are important for subtyping within tissues, as the cross-validated model classifies TCGA samples with 96.7% accuracy when using 750 gene features. was identified.

ヒトタンパク質アトラスは、癌腫瘍サンプルおよび健常組織サンプルからのTCGAトランスクリプトミクスおよび抗体ベースのタンパク質データを編集し、バイナリ検出とTOOのための遺伝子特徴の優先順位付けに使用した2つの特定のアトラスを提供する。組織アトラスには、正常組織におけるmRNAおよびタンパク質のレベルに基づき、組織濃縮遺伝子(他の組織と比較してその組織で発現が高い)および組織増強遺伝子(低い特異性で組織に発現)のアノテーションが含まれている。さらに、病理アトラスには、診断時の腫瘍発現レベルと患者の全生存率に基づき、癌タイプ濃縮遺伝子(他の腫瘍と比較してその腫瘍タイプで上昇)または癌タイプ増強遺伝子(低い特異性で腫瘍タイプに発現)、ならびに、疾患の予後に好ましい/好ましくない遺伝子のアノテーションが含まれている。乳癌と肺癌について、これらのアノテーションを有する遺伝子をバイオマーカー候補としてマークした(3028個の遺伝子特徴)。 The Human Protein Atlas compiled TCGA transcriptomics and antibody-based protein data from cancer tumor and healthy tissue samples, and two specific atlases used for binary detection and prioritization of gene features for TOO. provide. The tissue atlas includes annotations of tissue-enriched genes (highly expressed in that tissue compared to other tissues) and tissue-enhanced genes (expressed in tissues with low specificity) based on mRNA and protein levels in normal tissues. include. In addition, the pathology atlas includes cancer type-enriched genes (elevated in that tumor type compared to other tumors) or cancer type-enhanced genes (with low specificity) based on tumor expression levels at diagnosis and overall patient survival. expression in tumor types), as well as annotation of favorable/unfavorable genes for disease prognosis. Genes with these annotations were marked as biomarker candidates for breast and lung cancer (3028 gene signatures).

血漿中に見られる転写産物の大部分は、健常免疫細胞に由来すると考えられている。癌の検出を混乱させる可能性がある、健常白血球には存在しないバイオマーカーを選択するために、CCGAコホートの健常個人の血漿中での発現が低い遺伝子特徴をフィルタリングした(中央値RPM<1、標準偏差RPM<0.1)。これらの結果として得られる41391個の遺伝子特徴は、「ダークチャネル」と呼ばれる。バイナリ癌検出とTOOバイオマーカーを特定する際に前述のアプローチを統合することにより、これらのダークチャネルをさらにフィルタリングした。ダークチャネルは、癌関連遺伝子特徴について遺伝子バイナリ化LOR>0.1になるか、またはその遺伝子がランダムフォレストモデルによって選択された750個の遺伝子に含まれるようにフィルタリングされた。これらの遺伝子はさらにフィルタリングされ、ヒトタンパク質アトラスによってアノテーションが付けられるか、TCGAコホートでの平均発現が5RPMを超えるかのいずれかになった。実施例1~4からのさらなる陽性対照およびDCB遺伝子がこの更新されたバイオマーカーセットに追加され、cfRNAバイオマーカーの総数は467となり、これらは表15に列挙されている(そのサブセットは表11に提供されている)。表14の遺伝子は、特に有益なcfRNAバイオマーカーのサブセットを表す。乳癌および肺癌について選択されたバイオマーカーの結果の例を、それぞれ図10Aおよび20Bに示す。 Most of the transcripts found in plasma are thought to originate from healthy immune cells. To select biomarkers not present in healthy leukocytes that could confound cancer detection, we filtered gene features with low expression in the plasma of healthy individuals in the CCGA cohort (median RPM<1, standard deviation RPM<0.1). These resulting 41391 gene features are called the "dark channel". We further filtered these dark channels by integrating the aforementioned approaches in identifying TOO biomarkers with binary cancer detection. The dark channel was filtered such that the gene binarization LOR>0.1 for cancer-associated gene features or the gene was included in the 750 genes selected by the random forest model. These genes were further filtered and either annotated by the Human Protein Atlas or had average expression >5 RPM in the TCGA cohort. Additional positive controls and DCB genes from Examples 1-4 were added to this updated biomarker set, bringing the total number of cfRNA biomarkers to 467, which are listed in Table 15 (a subset of which is shown in Table 11). provided). The genes in Table 14 represent a subset of cfRNA biomarkers that are particularly informative. Examples of selected biomarker results for breast cancer and lung cancer are shown in FIGS. 10A and 20B, respectively.

実施例7:癌サンプルにおけるcfRNAバイオマーカーの評価
表15に示されている467個のcfRNAバイオマーカーを、腫瘍フラクションの低い検出困難な乳癌および肺癌において癌を同定し、非癌を区別する能力について試験した。すべてのサンプルは、サンプル中の任意の遺伝子で観察された最も高いエビデンスに基づいてスコア付けされた。高シグナル癌においてシグナルのエビデンスがあるすべての遺伝子を選択した。各サンプルについて、そのサンプルにおいて他のすべての非癌よりもエビデンスが多い遺伝子をすべて同定し、以下の基準を順番に用いて、各サンプルにおいてトップエビデンスの遺伝子によってサンプルをランク付けした:(1)任意の非癌で観察された最大カウント(低いほど良い)、(2)任意の高シグナル癌で観察された最大カウント(高いほど良い)、および(3)そのサンプルで観察された最大カウント。訓練およびホールドアウトアンプルセットでこれらのバイオマーカーを用いて、leave-one-out分類器が評価された。結果を図7に示す。アスタリスクで示されているように、検証コホートの特異性は訓練コホートと比較して大幅に減少した(p=0.02)。理論に束縛されることを望むものではないが、これは、この特定の実験における潜在的な過剰適合を示している可能性がある。
Example 7 Evaluation of cfRNA Biomarkers in Cancer Samples The 467 cfRNA biomarkers shown in Table 15 were evaluated for their ability to identify cancer and discriminate non-cancer in low tumor fraction, hard-to-detect breast and lung cancers. tested. All samples were scored based on the highest observed evidence for any gene in the sample. All genes with evidence of signal in high signal cancers were selected. For each sample, we identified all genes with more evidence than all other non-cancers in that sample and ranked the samples by the gene with the top evidence in each sample using the following criteria in order: (1). Maximum count observed in any non-cancer (lower is better), (2) maximum count observed in any high signal cancer (higher is better), and (3) maximum count observed in that sample. A leave-one-out classifier was evaluated using these biomarkers on the training and holdout ampoule sets. The results are shown in FIG. As indicated by the asterisk, the specificity of the validation cohort was significantly reduced compared to the training cohort (p=0.02). While not wishing to be bound by theory, this may indicate potential overfitting in this particular experiment.

cfRNAバイオマーカーに基づくleave-one-out分類器は、DNAメチル化癌バイオマーカーのシグナルが低いまたは高い癌サンプルに適用された。サンプルには肺癌と乳癌のサンプルが含まれていた。図8A~8Cに示すように、この分類器は高い特異性のパフォーマンスを実証した。 A leave-one-out classifier based on cfRNA biomarkers was applied to cancer samples with low or high DNA methylation cancer biomarker signals. Samples included lung and breast cancer samples. As shown in Figures 8A-8C, this classifier demonstrated high specificity performance.

いくつかの遺伝子は特に有益なcfRNA癌バイオマーカーであることが判明し、その中には乳癌または肺癌に特異性を持つ遺伝子、および乳癌と肺癌の両方で上昇する遺伝子もある。これら33個の遺伝子を上記の表8に示す。図26A~26Dには、ストリクトリードカウントについての結果がグラフで示されている。これら33個の遺伝子の結果に関する追加の詳細を以下の表16に示す。 Several genes have proven to be particularly valuable cfRNA cancer biomarkers, including genes with specificity for breast or lung cancer, and genes that are elevated in both breast and lung cancer. These 33 genes are shown in Table 8 above. Figures 26A-26D graphically show the results for strict read counts. Additional details regarding the results for these 33 genes are provided in Table 16 below.

Figure 2021257729000019
Figure 2021257729000019

参考文献
Klein et al. Development of a comprehensive cell-free DNA (cfDNA) assay for early detection of multiple tumor types: The Circulating Cell-free Genome Atlas (CCGA) study. ASCO (2018).
Uhlen et al. Tissue-based map of the human proteome (www.proteinatlas.org). Science doi:10.1126/science.1260419 (2015).
A. M. Newman, et al., An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage. Nat. Med. 20, 548-554 (2014).
E. Kirkizlar, et al., Detection of Clonal and Subclonal Copy-Number Variants in Cell-Free DNA from Patients with Breast Cancer Using a Massively Multiplexed PCR Methodology. Transl. Oncol. 8, 407-416 (2015).
S. Y. Shen, et al., Sensitive tumour detection and classification using plasma cell-free DNA methylomes. Nature 563, 579-583 (2018).
C. Bettegowda, et al., Detection of circulating tumor DNA in early- and late-stage human malignancies. Sci. Transl. Med. 6, 224ra24 (2014).
K. C. A. Chan, et al., Noninvasive detection of cancer-associated genome-wide hypomethylation and copy number aberrations by plasma DNA bisulfite sequencing. Proc. Natl. Acad. Sci. U. S. A. 110, 18761-18768 (2013).
I. S. Haque, O. Elemento, Challenges in Using ctDNA to Achieve Early Detection of Cancer. bioRxiv, 237578 (2017).
K. C. A. Chan, et al., Cancer genome scanning in plasma: detection of tumor-associated copy number aberrations, single-nucleotide variants, and tumoral heterogeneity by massively parallel sequencing. Clin. Chem. 59, 211-224 (2013).
C. Abbosh, et al., Phylogenetic ctDNA analysis depicts early-stage lung cancer evolution. Nature 545, 446-451 (2017).
K.-W. Lo, et al., Analysis of Cell-free Epstein-Barr Virus-associated RNA in the Plasma of Patients with Nasopharyngeal Carcinoma. Clin. Chem. 45, 1292-1294 (1999).
M. S. Kopreski, F. A. Benko, L. W. Kwak, C. D. Gocke, Detection of tumor messenger RNA in the serum of patients with malignant melanoma. Clin. Cancer Res. Off. J. Am. Assoc. Cancer Res. 5, 1961-1965 (1999).
J. D. Arroyo, et al., Argonaute2 complexes carry a population of circulating microRNAs independent of vesicles in human plasma. Proc. Natl. Acad. Sci. U. S. A. 108, 5003-5008 (2011).
P. M. Godoy, et al., Large Differences in Small RNA Composition Between Human Biofluids. Cell Rep. 25, 1346-1358 (2018).
M. F. de Souza, et al., Circulating mRNAs and miRNAs as candidate markers for the diagnosis and prognosis of prostate cancer. PLoS ONE 12 (2017).
G. Y. F. Ho, et al., Differential expression of circulating microRNAs according to severity of colorectal neoplasia. Transl. Res. 166, 225-232 (2015).
I. Lee, D. Baxter, M. Y. Lee, K. Scherler, K. Wang, The importance of standardization on analyzing circulating RNA. Mol. Diagn. Ther. 21, 259-268 (2017).
X. Q. Chen, et al., Telomerase RNA as a detection marker in the serum of breast cancer patients. Clin. Cancer Res. Off. J. Am. Assoc. Cancer Res. 6, 3823-3826 (2000).
17. R. C. Kamm, A. G. Smith, Ribonuclease activity in human plasma. Clin. Biochem. 5, 198-200 (1972).
T. El-Hefnawy, et al., Characterization of amplifiable, circulating RNA in plasma and its potential as a tool for cancer diagnostics. Clin. Chem. 50, 564-573 (2004).
N. B. Y. Tsui, E. K. O. Ng, Y. M. D. Lo, Stability of endogenous and added RNA in blood specimens, serum, and plasma. Clin. Chem. 48, 1647-1653 (2002).
J. D. Arroyo, et al., Argonaute2 complexes carry a population of circulating microRNAs independent of vesicles in human plasma. Proc. Natl. Acad. Sci. U. S. A. 108, 5003-5008 (2011).
G. J. S. Talhouarne, J. G. Gall, 7SL RNA in vertebrate red blood cells. RNA 24, 908-914 (2018).
L. A. Hancock, et al., Muc5b overexpression causes mucociliary dysfunction and enhances lung fibrosis in mice. Nat. Commun. 9, 1-10 (2018).
T. Handa, et al., Caspase14 expression is associated with triple negative phenotypes and cancer stem cell marker expression in breast cancer patients. J. Surg. Oncol. 116, 706-715 (2017).
R. Hrstka, et al., The pro-metastatic protein anterior gradient-2 predicts poor prognosis in tamoxifen-treated breast cancers. Oncogene 29, 4838-4847 (2010).
M. Pizzi, et al., Anterior gradient 2 overexpression in lung adenocarcinoma. Appl. Immunohistochem. Mol. Morphol. AIMM 20, 31-36 (2012).
H. Cho, A. B. Mariotto, L. M. Schwartz, J. Luo, S. Woloshin, When do changes in cancer survival mean progress? The insight from population incidence and mortality. J. Natl. Cancer Inst. Monogr. 2014, 187-197 (2014).
Y. M. Lo, et al., Rapid clearance of fetal DNA from maternal plasma. Am. J. Hum. Genet. 64, 218-224 (1999).
M. A. Watson, T. P. Fleming, Mammaglobin, a mammary-specific member of the uteroglobin gene family, is overexpressed in human breast cancer. Cancer Res. 56, 860-865 (1996).
G. H. Lewis, et al., Relationship between molecular subtype of invasive breast carcinoma and expression of gross cystic disease fluid protein 15 and mammaglobin. Am. J. Clin. Pathol. 135, 587-591 (2011).
R.-Z. Liu, et al., A fatty acid-binding protein 7/RXRβ pathway enhances survival and proliferation in triple-negative breast cancer. J. Pathol. 228, 310-321 (2012).
A. Cordero, et al., FABP7 is a key metabolic regulator in HER2+ breast cancer brain metastasis. Oncogene 38, 6445-6460 (2019).
H. Zhang, et al., The proteins FABP7 and OATP2 are associated with the basal phenotype and patient outcome in human breast cancer. Breast Cancer Res. Treat. 121, 41-51 (2010).
J. Xiao, et al., Eight potential biomarkers for distinguishing between lung adenocarcinoma and squamous cell carcinoma. Oncotarget 8, 71759-71771 (2017).
M. Grageda, P. Silveyra, N. J. Thomas, S. L. DiAngelo, J. Floros, DNA methylation profile and expression of surfactant protein A2 gene in lung cancer. Exp. Lung Res. 41, 93-102 (2015).
Z. Zhang, et al., High expression of SLC34A2 is a favorable prognostic marker in lung adenocarcinoma patients. Tumour Biol. J. Int. Soc. Oncodevelopmental Biol. Med. 39, 1010428317720212 (2017).
F. Diehl, et al., Circulating mutant DNA to assess tumor dynamics. Nat. Med. 14, 985-990 (2008).
Liu M.C. et al., Sensitive and specific multi-cancer detection and localization using methylation signatures in cell-free DNA. Ann Oncol. 31(6), 745-59 (2020).
References
Klein et al. Development of a comprehensive cell-free DNA (cfDNA) assay for early detection of multiple tumor types: The Circulating Cell-free Genome Atlas (CCGA) study. ASCO (2018).
Uhlen et al. Tissue-based map of the human proteome (www.proteinatlas.org). Science doi:10.1126/science.1260419 (2015).
AM Newman, et al., An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage. Nat. Med. 20, 548-554 (2014).
E. Kirkizlar, et al., Detection of Clonal and Subclonal Copy-Number Variants in Cell-Free DNA from Patients with Breast Cancer Using a Massively Multiplexed PCR Methodology. Transl. Oncol. 8, 407-416 (2015).
SY Shen, et al., Sensitive tumor detection and classification using plasma cell-free DNA methylomes. Nature 563, 579-583 (2018).
C. Bettegowda, et al., Detection of circulating tumor DNA in early- and late-stage human malignancies. Sci. Transl. Med. 6, 224ra24 (2014).
KCA Chan, et al., Noninvasive detection of cancer-associated genome-wide hypomethylation and copy number aberrations by plasma DNA bisulfite sequencing. Proc. Natl. Acad. Sci. USA 110, 18761-18768 (2013).
IS Haque, O. Elemento, Challenges in Using ctDNA to Achieve Early Detection of Cancer. bioRxiv, 237578 (2017).
KCA Chan, et al., Cancer genome scanning in plasma: detection of tumor-associated copy number aberrations, single-nucleotide variants, and tumoral heterogeneity by massively parallel sequencing. Clin. Chem. 59, 211-224 (2013).
C. Abbosh, et al., Phylogenetic ctDNA analysis depicts early-stage lung cancer evolution. Nature 545, 446-451 (2017).
K.-W. Lo, et al., Analysis of Cell-free Epstein-Barr Virus-associated RNA in the Plasma of Patients with Nasopharyngeal Carcinoma. Clin. Chem. 45, 1292-1294 (1999).
MS Kopreski, FA Benko, LW Kwak, CD Gocke, Detection of tumor messenger RNA in the serum of patients with malignant melanoma. Clin. Cancer Res. Off. J. Am. Assoc. Cancer Res. 5, 1961-1965 (1999) .
JD Arroyo, et al., Argonaute2 complexes carry a population of circulating microRNAs independent of vesicles in human plasma. Proc. Natl. Acad. Sci. USA 108, 5003-5008 (2011).
PM Godoy, et al., Large Differences in Small RNA Composition Between Human Biofluids. Cell Rep. 25, 1346-1358 (2018).
MF de Souza, et al., Circulating mRNAs and miRNAs as candidate markers for the diagnosis and prognosis of prostate cancer. PLoS ONE 12 (2017).
GYF Ho, et al., Differential expression of circulating microRNAs according to severity of colorectal neoplasia. Transl. Res. 166, 225-232 (2015).
I. Lee, D. Baxter, MY Lee, K. Scherler, K. Wang, The importance of standardization on analyzing circulating RNA. Mol. Diagn. Ther. 21, 259-268 (2017).
XQ Chen, et al., Telomerase RNA as a detection marker in the serum of breast cancer patients. Clin. Cancer Res. Off. J. Am. Assoc. Cancer Res.
17. RC Kamm, AG Smith, Ribonuclease activity in human plasma. Clin. Biochem. 5, 198-200 (1972).
T. El-Hefnawy, et al., Characterization of amplifiable, circulating RNA in plasma and its potential as a tool for cancer diagnostics. Clin. Chem. 50, 564-573 (2004).
NBY Tsui, EKO Ng, YMD Lo, Stability of endogenous and added RNA in blood specimens, serum, and plasma. Clin. Chem. 48, 1647-1653 (2002).
JD Arroyo, et al., Argonaute2 complexes carry a population of circulating microRNAs independent of vesicles in human plasma. Proc. Natl. Acad. Sci. USA 108, 5003-5008 (2011).
GJS Talhouarne, JG Gall, 7SL RNA in vertebrate red blood cells. RNA 24, 908-914 (2018).
LA Hancock, et al., Muc5b overexpression causes mucociliary dysfunction and enhances lung fibrosis in mice. Nat. Commun. 9, 1-10 (2018).
T. Handa, et al., Caspase14 expression is associated with triple negative phenotypes and cancer stem cell marker expression in breast cancer patients. J. Surg. Oncol. 116, 706-715 (2017).
R. Hrstka, et al., The pro-metastatic protein anterior gradient-2 predicts poor prognosis in tamoxifen-treated breast cancers. Oncogene 29, 4838-4847 (2010).
M. Pizzi, et al., Anterior gradient 2 overexpression in lung adenocarcinoma. Appl. Immunohistochem. Mol. Morphol.
H. Cho, AB Mariotto, LM Schwartz, J. Luo, S. Woloshin, When do changes in cancer survival mean progress? The insight from population incidence and mortality. J. Natl. Cancer Inst. Monogr. 2014, 187-197 ( 2014).
YM Lo, et al., Rapid clearance of fetal DNA from maternal plasma. Am. J. Hum. Genet. 64, 218-224 (1999).
MA Watson, TP Fleming, Mammaglobin, a mammary-specific member of the uteroglobin gene family, is overexpressed in human breast cancer. Cancer Res. 56, 860-865 (1996).
GH Lewis, et al., Relationship between molecular subtype of invasive breast carcinoma and expression of gross cystic disease fluid protein 15 and mammaglobin. Am. J. Clin. Pathol. 135, 587-591 (2011).
R.-Z. Liu, et al., A fatty acid-binding protein 7/RXRβ pathway enhances survival and proliferation in triple-negative breast cancer. J. Pathol. 228, 310-321 (2012).
A. Cordero, et al., FABP7 is a key metabolic regulator in HER2+ breast cancer brain metastasis. Oncogene 38, 6445-6460 (2019).
H. Zhang, et al., The proteins FABP7 and OATP2 are associated with the basal phenotype and patient outcome in human breast cancer. Breast Cancer Res. Treat. 121, 41-51 (2010).
J. Xiao, et al., Eight potential biomarkers for distinguishing between lung adenocarcinoma and squamous cell carcinoma. Oncotarget 8, 71759-71771 (2017).
M. Grageda, P. Silveyra, NJ Thomas, SL DiAngelo, J. Floros, DNA methylation profile and expression of surfactant protein A2 gene in lung cancer. Exp. Lung Res. 41, 93-102 (2015).
Z. Zhang, et al., High expression of SLC34A2 is a favorable prognostic marker in lung adenocarcinoma patients. Tumor Biol. J. Int. Soc.
F. Diehl, et al., Circulating mutant DNA to assess tumor dynamics. Nat. Med. 14, 985-990 (2008).
Liu MC et al., Sensitive and specific multi-cancer detection and localization using methylation signatures in cell-free DNA. Ann Oncol. 31(6), 745-59 (2020).

本開示を通じて、特許、特許出願、特許公報、雑誌、書籍、論文、ウェブコンテンツなど、他の文書への参照および引用がなされている。これらすべての文書は、あらゆる目的のために、参照によりその全体が本明細書に組み込まれる。 Throughout this disclosure, references and citations have been made to other documents, such as patents, patent applications, patent publications, journals, books, articles, web content. All these documents are hereby incorporated by reference in their entirety for all purposes.

本明細書に示され記載されたものに加えて、本発明のさまざまな変更およびその多くのさらなる実施形態は、本明細書に引用された科学文献および特許文献への参照を含む本明細書の全内容から当業者には明らかになるであろう。本明細書の主題は、本発明のさまざまな実施形態およびその等価物の実施に適応できる重要な情報、例示および指針を含んでいる。本明細書を通じて引用されたすべての文献は、参照により本明細書に明示的に組み込まれる。「本発明」等の用語は、本明細書に記載された出願人の発明の多くの代替的な態様または実施形態の特定の具体例を参照して使用されるものであり、その使用または不使用は、出願人の発明の範囲または特許請求の範囲を限定することを意図するものではない。本明細書は、読者の便宜のためにセクションに分けられている。見出しは、本発明の範囲を限定するものとして解釈されるべきではない。定義は本発明の説明の一部として意図されている。本発明の範囲から逸脱することなく、本発明のさまざまな細部を変更できることは理解されよう。さらに、前述の説明は例示を目的としたものであり、限定を目的としたものではない。 Various modifications of the invention and many additional embodiments thereof, in addition to those shown and described herein, are incorporated herein by reference to the scientific and patent literature cited herein. The full content will be apparent to those skilled in the art. The subject matter herein contains important information, examples and guidance applicable to the practice of various embodiments of the invention and its equivalents. All documents cited throughout this specification are expressly incorporated herein by reference. Terms such as the "present invention" are used with reference to specific examples of the many alternative aspects or embodiments of Applicants' invention described herein, and may be used or disclaimed. Usage is not intended to limit the scope of Applicant's invention or claims. This specification is divided into sections for the convenience of the reader. Headings should not be construed as limiting the scope of the invention. Definitions are intended as part of the description of the invention. It will be appreciated that various details of the invention can be changed without departing from the scope of the invention. Furthermore, the foregoing description is for the purpose of illustration and not for the purpose of limitation.

前述の実施形態の詳細な説明は、本開示の特定の実施形態を示す添付図面を参照する。異なる構造および動作を有する他の実施形態は、本開示の範囲から逸脱しない。「本発明」等の用語は、本明細書に記載された出願人の発明の多くの代替的な態様または実施形態の特定の具体例を参照して使用されるものであり、その使用または不使用は、出願人の発明の範囲または特許請求の範囲を限定することを意図するものではない。本明細書は、読者の便宜のためにセクションに分けられている。見出しは、本発明の範囲を限定するものとして解釈されるべきではない。定義は本発明の説明の一部として意図されている。本発明の範囲から逸脱することなく、本発明の様々な細部を変更できることは理解されよう。さらに、前述の説明は例示を目的としたものであり、限定を目的としたものではない。 The detailed description of the foregoing embodiments refers to the accompanying drawings that illustrate specific embodiments of the disclosure. Other embodiments having different structures and operations do not depart from the scope of the present disclosure. Terms such as the "present invention" are used with reference to specific examples of the many alternative aspects or embodiments of Applicants' invention described herein, and may be used or disclaimed. Usage is not intended to limit the scope of Applicant's invention or claims. This specification is divided into sections for the convenience of the reader. Headings should not be construed as limiting the scope of the invention. Definitions are intended as part of the description of the invention. It will be appreciated that various details of the invention can be changed without departing from the scope of the invention. Furthermore, the foregoing description is for the purpose of illustration and not for the purpose of limitation.

本発明をその具体的な実施形態を参照して説明したが、本発明の真の精神および範囲から逸脱することなく、さまざまな変更を加えることができ、等価物を代用することができることを当業者は理解すべきである。さらに、特定の状況、材料、物質組成、プロセス、プロセスステップ(複数可)に適合させるために、本発明の目的、精神および範囲に多くの変更を加えることができる。このような変更はすべて、添付の特許請求の範囲に含まれることを意図している。 Although the invention has been described with reference to specific embodiments thereof, it will be appreciated that various changes can be made and equivalents substituted without departing from the true spirit and scope of the invention. Traders should understand. In addition, many modifications may be made in the objective, spirit and scope of the invention to adapt a particular situation, material, composition of matter, process, process step(s). All such modifications are intended to be included within the scope of the claims appended hereto.

Claims (15)

対象における癌を検出する方法であって、
(a)前記対象のサンプル中の複数の標的無細胞RNA(cfRNA)分子を測定することであって、前記複数の標的cfRNA分子は少なくとも5つのダークチャネル遺伝子の転写産物を含み、前記少なくとも5つのダークチャネル遺伝子は表11から選択される、測定すること;および
(b)閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することを含む、前記癌を検出すること
を含む、方法。
1. A method for detecting cancer in a subject, comprising:
13. The method of claim 12, further comprising: (a) measuring a plurality of target cell-free RNA (cfRNA) molecules in a sample of the subject, wherein the plurality of target cfRNA molecules comprise transcripts of at least five dark channel genes, the at least five dark channel genes being selected from Table 11 ; and (b) detecting the cancer comprising detecting one or more of the target cfRNA molecules above a threshold level.
前記ダークチャネル遺伝子は
(i)参照非癌対象の大多数のcfRNAで発現が検出されないこと;
(ii)参照癌対象のcfRNAで発現が検出されること;および
(iii)前記参照非癌対象のcfRNAと比較して、前記参照癌対象のcfRNAで発現が増加していること
によって特徴付けられる、請求項1に記載の方法。
The dark channel gene is
(i) no detectable expression in the majority of cfRNAs in reference non-cancer subjects;
(ii) expression is detected in cfRNA of a reference cancer subject; and
(iii) the cfRNA of the reference cancer subject is increased in expression compared to the cfRNA of the reference non-cancer subject.
The method of claim 1 , characterized by:
前記複数の標的cfRNA分子が、表8および表12~14のうちの1つ以上に記載された少なくとも5、10、15または20個の遺伝子の転写産物から選択される、請求項1に記載の方法。 2. The method of claim 1, wherein the plurality of target cfRNA molecules are selected from transcripts of at least 5, 10, 15, or 20 genes listed in one or more of Tables 8 and 12-14 . 閾値を超えて検出された前記複数の標的cfRNA分子は、CEACAM5、RHOV、SFTA2、SCGB1D2、IGF2BP1、SFTPA1、CA12、SFTPB、CDH3、MUC6、SLC6A14、HOXC9、AGR3、TMEM125、TFAP2B、IRX2、POTEKP、ARHGEF38、GPR87、LMX1B、ATP10B、NELL1、MUC21、SOX9、LINC00993、STMND1、ERVH48-1、SCTR、MAGEA3、MB、LEMD1、SIX4およびNXNL2からなる群から選択される複数の遺伝子に由来するcfRNA分子である、請求項1に記載の方法。 The method of claim 1, wherein the target cfRNA molecules detected above the threshold are cfRNA molecules derived from a plurality of genes selected from the group consisting of CEACAM5, RHOV, SFTA2, SCGB1D2, IGF2BP1, SFTPA1, CA12, SFTPB, CDH3, MUC6, SLC6A14, HOXC9, AGR3, TMEM125, TFAP2B, IRX2, POTEKP, ARHGEF38, GPR87, LMX1B, ATP10B, NELL1, MUC21, SOX9, LINC00993, STMND1, ERVH48-1, SCTR, MAGEA3, MB, LEMD1, SIX4, and NXNL2. 前記複数の標的cfRNA分子は、(a)表8および表11~14のうちの1つ以上の転写産物、および(b)表1~6の1つ以上の転写産物または表7の1つ以上の転写産物を含む、請求項1に記載の方法。 2. The method of claim 1, wherein the plurality of target cfRNA molecules comprises: (a) one or more transcripts of Tables 8 and Tables 11-14, and (b) one or more transcripts of Tables 1-6 or one or more transcripts of Table 7 . (a)(i)前記癌は肺癌であり、(ii)閾値を超えて検出された前記複数の標的cfRNA分子は、表2、5および12のうちの1つ以上の転写産物から選択される;または
(b)(i)前記癌は乳癌であり、(ii)閾値を超えて検出された前記複数の標的cfRNA分子は、表3、4、6および13のうちの1つ以上の転写産物から選択される、請求項1に記載の方法。
(a) (i) the cancer is lung cancer, and (ii) the plurality of target cfRNA molecules detected above a threshold are selected from one or more transcripts in Tables 2, 5, and 12 ; or
2. The method of claim 1, wherein (b) (i) the cancer is breast cancer, and (ii) the plurality of target cfRNA molecules detected above a threshold are selected from one or more transcripts of Tables 3, 4, 6, and 13 .
前記測定することは、cfRNA分子をシーケンシングしてcfRNA配列リードを生成することを含む、請求項1~のいずれか1項に記載の方法。 The method of any one of claims 1 to 6 , wherein the measuring comprises sequencing cfRNA molecules to generate cfRNA sequence reads. 前記cfRNA分子をシーケンシングすることは、
(a)全トランスクリプトームシーケンシング
(b)cDNA分子を生成するための逆転写と、前記cfRNA配列リードを生成するために前記cDNA分子をシーケンシングすること;または
(c)前記標的cfRNA分子またはそのcDNA分子を濃縮すること
を含む、請求項に記載の方法。
Sequencing the cfRNA molecule comprises:
(a) Whole transcriptome sequencing ;
(b) reverse transcribing to generate cDNA molecules and sequencing the cDNA molecules to generate the cfRNA sequence reads; or
(c) enriching the target cfRNA molecule or its cDNA molecule.
The method of claim 7 , comprising:
閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することが、
(a)前記を有さない対象におけるレベルよりも少なくとも10倍高いレベルで、前記1つ以上の標的cfRNA分子を検出すること;または
(b)0.5~5リード・パー・ミリオン(reads per million(RPM))の閾値を超える検出
を含む、請求項1~のいずれか1項に記載の方法。
detecting one or more of the target cfRNA molecules above a threshold level;
(a) detecting the one or more target cfRNA molecules at a level at least 10-fold higher than the level in a subject without the cancer ; or
(b) detection above a threshold of 0.5-5 reads per million (RPM)
The method according to any one of claims 1 to 8 , comprising:
閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することは、
(a)各標的cfRNA分子の指標スコアを、前記標的cfRNA分子の各々の発現レベルをRNA組織スコア行列と比較することにより決定すること;
(b)各標的cfRNA分子の前記指標スコアを集計すること;および
(c)前記指標スコアが閾値を超えるときに前記癌を検出することを含む、請求項1~のいずれか1項に記載の方法。
Detecting one or more of the target cfRNA molecules above a threshold level includes:
(a) determining an index score for each target cfRNA molecule by comparing the expression level of each of said target cfRNA molecules to an RNA tissue score matrix;
9. The method of claim 1 , comprising: (b) tabulating the index score for each target cfRNA molecule; and (c) detecting the cancer when the index score exceeds a threshold.
閾値レベルを超える前記標的cfRNA分子の1つ以上を検出することが、前記配列リードを機械学習または深層学習モデルに入力することを含む、請求項に記載の方法。 8. The method of claim 7 , wherein detecting one or more of the target cfRNA molecules above a threshold level comprises inputting the sequence reads into a machine learning or deep learning model. (a)前記機械学習または深層学習モデルは、ロジスティック回帰、ランダムフォレスト、勾配ブースティングマシン、ナイーブベイズ、ニューラルネットワーク、または多項式回帰を含む;または
(b)前記機械学習または深層学習モデルが、学習された重み(learned weights)を含む関数を介して、1つ以上の特徴の値を前記対象の前記疾患状態予測に変換する、請求項11に記載の方法。
(a) the machine learning or deep learning model comprises logistic regression, random forest, gradient boosting machine, naive Bayes, neural network, or polynomial regression ; or
12. The method of claim 11 , wherein (b) the machine learning or deep learning model transforms values of one or more features into the disease state prediction for the subject via a function that includes learned weights .
前記癌は、
(i)癌腫、肉腫、骨髄腫、白血病、リンパ腫、芽細胞腫、胚細胞腫瘍、またはそれらの任意の組み合わせ;
(ii)腺癌、扁平上皮癌、小細胞肺癌、非小細胞肺癌、上咽頭癌、結腸直腸癌、肛門癌、肝臓癌、膀胱癌、精巣癌、子宮頸癌、卵巣癌、胃癌、食道癌、頭頸部癌、膵臓癌、前立腺癌、腎臓癌、甲状腺癌、メラノーマおよび乳癌からなる群から選択される癌腫;
(iii)ホルモン受容体陰性乳癌またはトリプルネガティブ乳癌;
(iv)骨肉腫、軟骨肉腫、平滑筋肉腫、横紋筋肉腫、中皮肉腫(中皮腫)、線維肉腫、血管肉腫、脂肪肉腫、神経膠腫および星細胞腫からなる群から選択される肉腫;
(v)骨髄性白血病、顆粒球性白血病、リンパ性白血病、リンパ球性白血病およびリンパ芽球性白血病からなる群から選択される白血病;または
(vi)ホジキンリンパ腫および非ホジキンリンパ腫からなる群から選択されるリンパ腫
を含む、請求項1~のいずれか1項に記載の方法。
The cancer is
(i) carcinoma, sarcoma, myeloma, leukemia, lymphoma, blastoma, germ cell tumor, or any combination thereof;
(ii) a carcinoma selected from the group consisting of adenocarcinoma, squamous cell carcinoma, small cell lung cancer, non-small cell lung cancer, nasopharyngeal cancer, colorectal cancer, anal cancer, liver cancer, bladder cancer, testicular cancer, cervical cancer, ovarian cancer, gastric cancer, esophageal cancer, head and neck cancer, pancreatic cancer, prostate cancer, kidney cancer, thyroid cancer, melanoma and breast cancer;
(iii) hormone receptor-negative or triple-negative breast cancer;
(iv) a sarcoma selected from the group consisting of osteosarcoma, chondrosarcoma, leiomyosarcoma, rhabdomyosarcoma, mesothelioma, fibrosarcoma, angiosarcoma, liposarcoma, glioma, and astrocytoma;
(v) a leukemia selected from the group consisting of myeloid leukemia, granulocytic leukemia, lymphocytic leukemia, lymphocytic leukemia and lymphoblastic leukemia; or (vi) a lymphoma selected from the group consisting of Hodgkin's lymphoma and non- Hodgkin 's lymphoma.
前記癌を検出することが、癌のステージを決定すること、癌の進行を決定すること、癌の種類を決定すること、癌の起源組織を決定すること、またはそれらの組み合わせを含む、請求項1~のいずれか1項に記載の方法。 9. The method of claim 1, wherein detecting the cancer comprises determining a stage of the cancer, determining a progression of the cancer, determining a type of the cancer, determining a tissue of origin of the cancer , or a combination thereof. 請求項1~14のいずれか1項に記載の方法を実装するためのコンピュータ可読命令を格納した、非一時的なコンピュータ可読媒体。
A non-transitory computer readable medium having stored thereon computer readable instructions for implementing the method of any one of claims 1 to 14 .
JP2022566136A 2020-06-16 2021-06-16 Cell-free RNA analysis method Pending JP2023534094A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063039886P 2020-06-16 2020-06-16
US63/039,886 2020-06-16
PCT/US2021/037668 WO2021257729A2 (en) 2020-06-16 2021-06-16 Methods for analysis of cell-free rna

Publications (2)

Publication Number Publication Date
JP2023534094A JP2023534094A (en) 2023-08-08
JPWO2021257729A5 true JPWO2021257729A5 (en) 2024-05-23

Family

ID=78824561

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022566136A Pending JP2023534094A (en) 2020-06-16 2021-06-16 Cell-free RNA analysis method

Country Status (7)

Country Link
US (1) US20210388451A1 (en)
EP (1) EP4165206A2 (en)
JP (1) JP2023534094A (en)
CN (1) CN115698321A (en)
AU (1) AU2021292521A1 (en)
CA (1) CA3177118A1 (en)
WO (1) WO2021257729A2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230086722A1 (en) * 2021-09-10 2023-03-23 Grail, Llc Methods for analysis of target molecules in biological fluids
WO2023147445A2 (en) * 2022-01-27 2023-08-03 Oregon Health & Science University Cell-free rna biomarkers for the detection of cancer or predisposition to cancer
GB2623570A (en) * 2022-10-21 2024-04-24 Wobble Genomics Ltd Method and products for biomarker identification
CN116825177A (en) * 2023-06-28 2023-09-29 北京津渡生科科技有限公司 Free RNA liver cancer early screening method and system based on statistics and random forest

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110198711A (en) * 2016-11-22 2019-09-03 第一基因股份有限公司 Method for detecting cancer
AU2019253118B2 (en) * 2018-04-13 2024-02-22 Freenome Holdings, Inc. Machine learning implementation for multi-analyte assay of biological samples
CA3090426A1 (en) * 2018-04-14 2019-10-17 Natera, Inc. Methods for cancer detection and monitoring by means of personalized detection of circulating tumor dna
EP3810806A1 (en) * 2018-06-22 2021-04-28 Bluestar Genomics, Inc. Hydroxymethylation analysis of cell-free nucleic acid samples for assigning tissue of origin, and related methods of use
US20200105375A1 (en) * 2018-09-28 2020-04-02 Grail, Inc. Models for targeted sequencing of rna
CA3121923A1 (en) * 2018-12-18 2020-06-25 Wenying Pan Methods for detecting disease using analysis of rna

Similar Documents

Publication Publication Date Title
JP5670055B2 (en) Methods for determining cancer resistance to histone deacetylase inhibitors
US11512349B2 (en) Methods for detecting disease using analysis of RNA
US20210388451A1 (en) Methods for analysis of cell-free rna
JP2020530290A (en) Methods and Substances for Assessing and Treating Cancer
US20190292600A1 (en) Nasal epithelium gene expression signature and classifier for the prediction of lung cancer
EP4110957A2 (en) Methods of analyzing cell free nucleic acids and applications thereof
US20210164054A1 (en) Biomarkers for cancer immunotherapy outcomes
AU2019392939A1 (en) Transcriptomic profiling for prognosis of breast cancer
US20220057400A1 (en) Il-6 signaling and breast cancer
JPWO2021257729A5 (en)
US20230086722A1 (en) Methods for analysis of target molecules in biological fluids
WO2023023123A1 (en) Compositions and methods for cell-free dna epigenetic gastrointestinal cancer detection and treatment
US20220347278A1 (en) Blood-based biomarkers and use thereof for treating cancer
WO2022246000A1 (en) Compositions and methods for determining dna methylation level in cancer
WO2022082048A1 (en) Methods of treating breast cancer
WO2022246002A2 (en) Methods and compositions for determining cancer risk
WO2022235701A1 (en) Gene expression profiling methods and compositions for determining cancer and treatment thereof
EP4341689A1 (en) Method for detecting medical conditions using analysis of very small embryonic-like stem cells