JP7005596B2 - Detection of chromosomal interactions associated with breast cancer - Google Patents

Detection of chromosomal interactions associated with breast cancer Download PDF

Info

Publication number
JP7005596B2
JP7005596B2 JP2019510481A JP2019510481A JP7005596B2 JP 7005596 B2 JP7005596 B2 JP 7005596B2 JP 2019510481 A JP2019510481 A JP 2019510481A JP 2019510481 A JP2019510481 A JP 2019510481A JP 7005596 B2 JP7005596 B2 JP 7005596B2
Authority
JP
Japan
Prior art keywords
chromosomal
episwitch
probe
dna
interactions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019510481A
Other languages
Japanese (ja)
Other versions
JP2019521701A (en
Inventor
ハンター、ユアン
ウォマースリー、ハワード
ラマダス、アロール
アコーリトチェフ、アレクサンドル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford Biodynamics PLC
Original Assignee
Oxford Biodynamics PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford Biodynamics PLC filed Critical Oxford Biodynamics PLC
Publication of JP2019521701A publication Critical patent/JP2019521701A/en
Application granted granted Critical
Publication of JP7005596B2 publication Critical patent/JP7005596B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/101Crosslinking agents, e.g. psoralen
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/501Detection characterised by immobilisation to a surface being an array of oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medicinal Chemistry (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicinal Preparation (AREA)

Description

本発明は、染色体相互作用の検出に関する。 The present invention relates to the detection of chromosomal interactions.

がんは、細胞増殖および***における調節の喪失によって引き起こされる。これは、細胞が突然変異を修正できずに、細胞のDNAに突然変異が生じた場合に起こり、突然変異は遺伝性(生殖細胞系)または発達性(後天性)のいずれかであり得る。がんには良性と悪性の2つのタイプがあり、良性がんは、細胞***の調節の喪失が起きた場合に発症するが、腫瘍は身体の他の部分に広がらない。悪性(または転移性)がんはより深刻であり、がん細胞が血流またはリンパ系を介して体の他の部分に移動した場合に発症する。乳がんは、***から始まるがんの名称であり、世界で2番目に多いがんである。2012年に推定1,410万人の新たながん症例が発症した。現在、マンモグラムを用いた癌スクリーニングが、***の何らかの異常を検査するためのゴールドスタンダードであり、腫瘤が検出されると生検が行われる。浸潤性乳がんの組織学的グレーディングは、浸潤性乳がん患者を予後の異なる3つの群:良好、中程度、および不良に分類するために用いられる。 Cancer is caused by loss of regulation in cell proliferation and division. This occurs when the cell is unable to correct the mutation and a mutation occurs in the cell's DNA, which can be either hereditary (germline) or developmental (acquired). There are two types of cancer, benign and malignant. Benign cancers develop when loss of control of cell division occurs, but tumors do not spread to other parts of the body. Malignant (or metastatic) cancers are more serious and develop when cancer cells migrate to other parts of the body through the bloodstream or lymphatic system. Breast cancer is the name of the cancer that begins in the breast and is the second most common cancer in the world. In 2012, an estimated 14.1 million new cancer cases developed. Currently, cancer screening using a mammogram is the gold standard for examining any abnormalities in the breast, and a biopsy is performed when a mass is detected. Histological grading of invasive breast cancer is used to classify patients with invasive breast cancer into three groups with different prognosis: good, moderate, and poor.

遺伝子座における特定の染色体コンフォメーションシグネチャー(CCS)は、病理学または治療に関連する調節的なエピジェネティック制御の設定により、存在または非存在となる。CCSは軽度の解離速度を有し、特定の表現型または病理を表す場合、それらは、新しい表現型への生理学的なシグナル伝達により、または外部介入の結果としてのみ変化する。さらに、これらの事象の測定値はバイナリであるため、この読出しは、DNAメチル化、ヒストン修飾およびほとんどの非コードRNAのさまざまなレベルの連続読出しとは著しく対照的である。現在までの大部分の分子バイオマーカーに用いられている連続読出しは、特定のバイオマーカーの変化の大きさが患者によって大きく変動するという点で、データ分析に困難な課題を提供し、患者のコホートを層別化するために使用される場合、分類統計に関して問題を引き起こす。これらの分類統計は、大きさの欠けているバイオマーカーの使用によくて適しており、表現型の違いの「はい または いいえ」バイナリスコアを提供し、EpiSwitch(商標)バイオマーカーが、潜在的な診断、予後および予測バイオマーカーのための優れた供給源であることを示す。 Certain chromosomal conformational signatures (CCS) at loci are present or absent, depending on the setting of regulatory epigenetic regulation associated with pathology or treatment. CCS have a mild rate of dissection, and if they represent a particular phenotype or pathology, they change only by physiological signaling to the new phenotype or as a result of external intervention. Moreover, since the measurements of these events are binary, this read is in sharp contrast to DNA methylation, histone modifications and continuous reads of various levels of most non-coding RNAs. The continuous readout used for most molecular biomarkers to date presents a difficult task for data analysis in that the magnitude of change in a particular biomarker varies widely from patient to patient, providing a cohort of patients. Causes problems with classification statistics when used to stratify. These classification statistics are well suited for the use of biomarkers lacking size and provide a "yes or no" binary score for phenotypic differences, with the EpiSwitch ™ biomarker being a potential. Shows that it is an excellent source for diagnostic, prognostic and predictive biomarkers.

本発明者らは、集団内のサブグループの同定を可能にするアプローチを使用して、染色体相互作用が乳がんに関連するゲノムの領域を同定した。したがって、本発明は、集団内のサブグループを表す染色体状態を検出するプロセスであって、ゲノムの規定された乳がん疾患関連領域内における染色体相互作用の有無を判定する工程を含む方法を提供する。この染色体相互作用は、どの染色体相互作用が集団の乳がんサブグループに対応する染色体状態に関連するかを判定する方法であって、染色体の状態が異なるサブグループ由来の第1の核酸セットと、指標となる第2の核酸セットとを接触させる工程、および相補的配列をハイブリダイズさせる工程を含み、第1および第2の核酸セット中の核酸が、染色体相互作用において一体となる両方の染色体領域からの配列を含む連結産物を表し、第1の核酸セットと第2の核酸セットとの間のハイブリダイゼーションのパターンが、どの染色体相互作用が乳がんサブグループに特異的であるかの判定を可能にする方法によって、任意に、同定されている、または同定可能(または推論可能)である。 We have identified regions of the genome where chromosomal interactions are associated with breast cancer using an approach that allows the identification of subgroups within the population. Accordingly, the present invention provides a process of detecting a chromosomal state representing a subgroup within a population, comprising the step of determining the presence or absence of chromosomal interactions within a defined breast cancer disease-related region of the genome. This chromosomal interaction is a method of determining which chromosomal interaction is associated with the chromosomal state corresponding to the breast cancer subgroup of the population, with a first set of nucleic acids from subgroups with different chromosomal states and an index. From both chromosomal regions where the nucleic acids in the first and second chromosomal sets are united in chromosomal interactions, including contacting with a second set of nucleic acids to be and hybridizing complementary sequences. Represents a linkage product containing the sequence of, and the pattern of hybridization between the first and second nucleic acid sets allows the determination of which chromosomal interaction is specific to the breast cancer subgroup. Arbitrarily identified or identifiable (or inferrable) by the method.

BCa1およびBCa2アレイの有意なプローブの比較の図である。プローブはp値<0.05に調整した。It is a figure of comparison of the significant probe of BCa1 and BCa2 arrays. The probe was adjusted to p-value <0.05. このベン図は、マーカー削減セット(118、セット1)とモデル検証セット(50、セット2)に分割された患者セットを示す図である。他の患者セットは、部位2シップメント122から除外された対照を指す。This Venn diagram shows a patient set divided into a marker reduction set (118, set 1) and a model validation set (50, set 2). The other patient set refers to controls excluded from site 2 shipment 122. GLMNETモデルの交差検証プロットを使用して、ラムダ(ロジスティックモデルのペナルティ化された値)と係数(最小誤差)を選択する図である。Y軸は平均二乗誤差である。X軸はlog(λ)である。It is a figure which selects a lambda (penalized value of a logistic model) and a coefficient (minimum error) using a cross-validation plot of a GLMNET model. The Y-axis is the mean square error. The X-axis is log (λ). シップメント122についての外れ値の品質管理の図である。最終的なBrCaモデルからの8つのマーカーを用いた、部位2由来対照サンプルの因子分析(主成分分析)プロット。三角(部位2_b2)で示される患者はシップメント122(30人の患者)由来であり、これらは全分析から除外され、丸(部位_2)で示された患者は、使用されたシップメント113(25人の患者)由来の部位2の対照である。このプロットは、同じ位置に由来するこれらの対照内に、比較の観点から生物学的にBrCaと類似することを意味する患者を分離する、大きな変動成分が存在することを示す。この変動は、最終モデルにおけるBrCaと対照との間の差異について競合するため、懸念事項となり、したがって、部位2バッチ2シップメント122サンプルは除外された。Y軸はDim2 16.79%である。X軸はDim1 18.11%である。It is a figure of quality control of an outlier about shipment 122. Factor analysis (principal component analysis) plots of site 2 derived control samples using 8 markers from the final BrCa model. Patients indicated by the triangle (site 2_b2) were from shipment 122 (30 patients), these were excluded from the entire analysis, and patients indicated by circles (site_2) were used shipment 113 (site 2_b2). It is a control of site 2 from 25 patients). This plot shows that within these controls from the same location there is a large variable component that separates patients, which means that they are biologically similar to BrCa from a comparative point of view. This variation was a concern as it competed for differences between BrCa and controls in the final model, and therefore the site 2 batch 2 shipment 122 samples were excluded. The Y-axis is Dim2 16.79%. The X-axis is Dim1 18.11%. 最終的なBrCaモデルからの8つのマーカーを用いた、分析に使用したすべての対照サンプル(69の対照)についての因子分析(主成分分析)プロットを示す図である。患者にはわずかな地理的変動があるが、これは部位2対照(シップメント122)の外れ値の群との変動よりも小さい。丸は部位1である。三角形は部位2である。黒四角は部位3である。十字は部位4である。交差四角は部位5である。Y軸はDim2 11.57%である。Y軸はDim1 15.47%である。FIG. 5 shows factor analysis (principal component analysis) plots for all control samples (69 controls) used in the analysis using 8 markers from the final BrCa model. Patients have slight geographic variation, which is less than the variation with the outlier group of site 2 controls (shipment 122). The circle is part 1. The triangle is part 2. The black square is part 3. The cross is part 4. The crossing square is part 5. The Y-axis is Dim2 11.57%. The Y-axis is Dim1 15.47%. 最終的なBrCaモデルからの8つのマーカーを用いた、分析に使用したすべての対照サンプル(69の対照)、および部位2の30の除外された外れ値群(シップメント122-十字円として示す)についての、因子分析(主成分分析)プロットを示す図である。データの広がりは、主に部位2シップメント122の問題によるものである。黒菱形は部位1である。黒丸は部位2である。黒四角は部位3である。黒三角は部位4である。十字は部位5である。白三角は部位6である。十字円は部位2_b2である。Y軸はDim2 11.14%である。X軸はDim1 12.36%である。All control samples used in the analysis (69 controls) using 8 markers from the final BrCa model, and 30 excluded outlier groups at site 2 (shown as Shipment 122-Cross Circle). It is a figure which shows the factor analysis (principal component analysis) plot about. The spread of data is mainly due to the problem of site 2 shipment 122. The black rhombus is part 1. The black circle is part 2. The black square is part 3. The black triangle is part 4. The cross is part 5. The white triangle is part 6. The cross circle is part 2_b2. The Y-axis is Dim2 11.14%. The X-axis is Dim1 12.36%. マーカーATM_11_108118137_108126372_108155279_108156687_RFの結果を示す図である。第1の図は、ATMプライマー54および56、472bpの分析2による増幅を示す。第2の図は標準曲線を示す。FAMが使用されている。効率は91.7%であり、Rは0.996であり、傾きは-3.539であり、y-切片は39.706であることがわかる。It is a figure which shows the result of the marker ATM_11_108118137_108126372_108155527_10815687_RF. The first figure shows the amplification of ATM primers 54 and 56, 472bp by Analysis 2. The second figure shows a standard curve. FAM is used. It can be seen that the efficiency is 91.7%, R 2 is 0.996, the slope is -3.539, and the y-intercept is 39.706. ATM_11_108118137_108126372_108155279_108156687_RFの増幅線を示す図である。第1の図は、ATMプライマー54および56、472bpの分析2行Cによる増幅を示す。第2の図は、ATMプライマー54および56、472bpの分析2行Dによる増幅を示す。It is a figure which shows the amplification line of ATM_11_108118137_108126372_108155527_108156687_RF. The first figure shows the amplification of ATM primers 54 and 56, 472bp by analysis 2 row C. The second figure shows the amplification of ATM primers 54 and 56, 472bp by analysis 2 row D. マーカーCDC6_17_38421089_38423079_38451196_38457050_FFの結果を示す図である。第1の図は、PCR2 CDC6 FFによる増幅を示す。第2の図は標準曲線を示す。FAMが使用されている。効率は90.7%であり、Rは0.990であり、傾きは-3.568であり、y-切片は40.652であることがわかる。It is a figure which shows the result of the marker CDC6_17_38421089_38423079_38451196_38457050_FF. The first figure shows amplification by PCR2 CDC6 FF. The second figure shows a standard curve. FAM is used. It can be seen that the efficiency is 90.7%, R 2 is 0.990, the slope is -3.568, and the y-intercept is 40.652. マーカーFOXC1_6_1577253_1581989_1604206_1605973_FRの結果を示す図である。第1の図は、ATM 208bp FOXC1による増幅を示す。第2の図は標準曲線を示す。FAMが使用されている。効率は101.6%、Rは0.992、勾配は-3.284、y-切片は37.746であることがわかる。It is a figure which shows the result of the marker FOXC1_6_1577253_1581989_1604206_1605973_FR. The first figure shows amplification by ATM 208bp FOXC1. The second figure shows a standard curve. FAM is used. It can be seen that the efficiency is 101.6%, R 2 is 0.992, the gradient is -3.284, and the y-intercept is 37.746. マーカーFOXC1_6_1577253_1581989_1604206_1605973_FRの増幅線を示す図である。第1の図は、ATM 208bp、行Cによる増幅を示す。第2図は、ATM 208bp、行Dによる増幅を示す。It is a figure which shows the amplification line of the marker FOXC1_6_1577253_1581989_1604206_1605973_FR. The first figure shows amplification by ATM 208bp, row C. FIG. 2 shows amplification by ATM 208bp, row D. マーカーMAP3K1_5_56102259_56110500_56140227_56144076_FFの結果を示す図である。第1の図は、増幅PCR9 MAP3K1細胞C1~C6(RFU対サイクル)を示す。第2の図はウェルC1~C6の融解ピークを示す。y軸は-d(RFU)/dtを示す。x軸は摂氏温度を示す。It is a figure which shows the result of the marker MAP3K1_5_56102259_56110500_56140227_56144076_FF. The first figure shows amplified PCR9 MAP3K1 cells C1-C6 (RFU vs. cycle). The second figure shows the melting peaks of wells C1 to C6. The y-axis indicates −d (RFU) / dt. The x-axis indicates the temperature in degrees Celsius. マーカーMAP3K1_5_56102259_56110500_56140227_56144076_FFの結果を示す。第1の図は、MAP3K1 495bpによる増幅を示す。第2の図は標準曲線を示す。FAMが使用されている。効率は91.9%であり、Rは0.999であり、傾きは-3.533であり、y-切片は40.940であることがわかる。The result of the marker MAP3K1_5_56102259_56110500_56140227_56144076_FF is shown. The first figure shows amplification by MAP3K1 495bp. The second figure shows a standard curve. FAM is used. It can be seen that the efficiency is 91.9%, R 2 is 0.999, the slope is -3.533, and the y-intercept is 40.940. マーカーME3_11_86300063_86304401_86420537_86426200_FRの結果を示す図である。第1の図は増幅ME3 PCR12、A7~A12(RFU対サイクル)を示す。第2の図は溶融ピークを示す。y軸は-d(RFU)/dtを示す。x軸は摂氏温度を示す。It is a figure which shows the result of the marker ME3_11_86300063_86304401_86420537_86426200_FR. The first figure shows amplified ME3 PCR12, A7-A12 (RFU vs. cycle). The second figure shows the melting peak. The y-axis indicates −d (RFU) / dt. The x-axis indicates the temperature in degrees Celsius. マーカーME3_11_86300063_86304401_86420537_86426200_FRの結果を示す図である。第1の図は、ME3 291bpによる増幅を示す。第2の図は標準曲線を示す。FAMが使用されている。効率は96.8%、Rは0.998、勾配は-3.400、y-切片は39.596であることがわかる。It is a figure which shows the result of the marker ME3_11_86300063_86304401_86420537_86426200_FR. The first figure shows amplification by ME3 291bp. The second figure shows a standard curve. FAM is used. It can be seen that the efficiency is 96.8%, R 2 is 0.998, the gradient is -3.40, and the y-intercept is 39.596. マーカーMELK_9_36577630_36579243_36637050_36643005_RFの結果を示す図である。第1の図は、MELK 207bpによる増幅を示す。第2の図は標準曲線を示す。FAMが使用されている。効率は91.3%、Rは0.995、勾配は-3.550、y-切片は42.000であることがわかる。It is a figure which shows the result of the marker MELK_9_36577630_36579243_36637050_36643005_RF. The first figure shows amplification by MELK 207bp. The second figure shows a standard curve. FAM is used. It can be seen that the efficiency is 91.3%, R 2 is 0.995, the gradient is -3.550, and the y-intercept is 42.000. マーカーMSH3_5_80021913_80025030_80153948_80159012_RFの結果を示す図である。第1の図はMSH3 207bpによる増幅を示す。第2の図は標準曲線を示す。FAMが使用されている。効率は97.1%、Rは0.990、勾配は-3.394、y-切片は41.876であることがわかる。It is a figure which shows the result of the marker MSH3_5_80021913_80025030_80153948_80159012_RF. The first figure shows amplification by MSH3 207bp. The second figure shows a standard curve. FAM is used. It can be seen that the efficiency is 97.1%, R 2 is 0.990, the gradient is -3.394, and the y-intercept is 41.876. マーカーNF1_17_29477103_29483764_29651799_29657368_FFの結果を示す図である。第1の図はNF1 401bpによる増幅を示す。第2の図は標準曲線を示す。FAMが使用されている。効率は99.0%であり、Rは0.987であり、傾きは-3.347であり、y-切片は40.192であることがわかる。It is a figure which shows the result of the marker NF1_17_29477103_29483764_2965-1799_29657368_FF. The first figure shows amplification by NF1 401bp. The second figure shows a standard curve. FAM is used. It can be seen that the efficiency is 99.0%, R 2 is 0.987, the slope is -3.347, and the y-intercept is 40.192. マーカーSRD5A1_5_6634973_6639025_6667775_6669711_RFの結果を示す図である。標準曲線のみが患者データなしで示される。第1の図はSRDA51による増幅を示す。第2の図は標準曲線を示す。FAMが使用されている。効率は95.5%であり、Rは0.997であり、傾きは-3.434であり、y-切片は39.761であることがわかる。It is a figure which shows the result of the marker SRD5A1_5_6634973_6639025_66677775_6669711_RF. Only standard curves are shown without patient data. The first figure shows amplification by SRDA51. The second figure shows a standard curve. FAM is used. It can be seen that the efficiency is 95.5%, R 2 is 0.997, the slope is -3.434, and the y-intercept is 39.761. マーカーTSPYL5_8_98276431_98282736_98316421_98318720_FFの結果を示す図である。標準曲線のみが患者データなしで示される。第1の図はTSPYL5による増幅を示す。第2の図は標準曲線を示す。FAMが使用されている。効率は94.2%、Rは0.998、勾配は-3.469、y-切片は41.344であることがわかる。It is a figure which shows the result of the marker TSPYL5_8_98276431_98282736_98316421_983188720_FF. Only standard curves are shown without patient data. The first figure shows amplification by TSPYL5. The second figure shows a standard curve. FAM is used. It can be seen that the efficiency is 94.2%, R 2 is 0.998, the gradient is -3.469, and the y-intercept is 41.344. 例2のマーカーセット2に対応するデータを示す図である。ループ検出データは、マーカーががん疾患サンプルと関連しているか、または対照サンプルと関連しているかどうかを示す。It is a figure which shows the data corresponding to the marker set 2 of Example 2. Loop detection data indicate whether the marker is associated with a cancer disease sample or a control sample. 例3のマーカーセット3に対応するデータを示す図である。ループ検出データは、マーカーが悪性疾患サンプルと関連しているか、または対照サンプルと関連しているかどうかを示す。統計量は、ネステッドPCR作業について示されている。It is a figure which shows the data corresponding to the marker set 3 of Example 3. Loop detection data indicate whether the marker is associated with a malignant disease sample or a control sample. Statistics are shown for nested PCR work.

増幅曲線を示すすべての図において、Y軸はRFUであり、X軸はサイクルであり、行Cのウェルについては、患者サンプルの増幅ラインはXで記され、行Dでは患者増幅曲線が三角(△)で示される。 In all figures showing the amplification curve, the Y-axis is RFU, the X-axis is the cycle, for wells in row C, the amplification line of the patient sample is marked with an X, and in row D the patient amplification curve is triangular (in row D). It is indicated by Δ).

標準曲線を示すすべての図において、Y軸はCqであり、X軸はログ開始量であり、丸は標準で十字は不明である。 In all figures showing the standard curve, the Y-axis is Cq, the X-axis is the log start amount, the circle is standard and the cross is unknown.

本発明のプロセス
本発明のプロセスは、乳がんに関連する染色体相互作用を検出するための型付けシステムを含む。この型付けは、染色体相互作用において一体となる染色体の架橋領域に基づく、本明細書に記載のEpiSwitch(商標)システムを使用して実施することができ、染色体DNAに切断を施し、次いで架橋体に存在する核酸を連結して、染色体相互作用を形成した両方の領域からの配列を有する連結核酸を得る。この連結核酸の検出は、特定の染色体相互作用の有無の判定を可能にする。
Processes of the Invention The processes of the invention include a typing system for detecting chromosomal interactions associated with breast cancer. This typing can be performed using the EpiSwitch ™ system described herein, which is based on the cross-linking regions of the chromosomes that are integrated in the chromosomal interaction, where the chromosomal DNA is cleaved and then cross-linked. The existing nucleic acids are ligated to give ligated nucleic acids with sequences from both regions that have formed chromosomal interactions. Detection of this linked nucleic acid makes it possible to determine the presence or absence of a particular chromosomal interaction.

染色体相互作用は、第1および第2の核酸集団が使用される上記の方法を用いて同定することができる。これらの核酸は、EpiSwitch(商標)技術を用いて生成することもできる。 Chromosome interactions can be identified using the methods described above in which the first and second nucleic acid populations are used. These nucleic acids can also be produced using EpiSwitch ™ technology.

本発明に関係するエピジェネティック相互作用
本明細書中で使用される場合、「エピジェネティック」相互作用および「染色体」相互作用という用語は、典型的には染色体の遠位領域間の相互作用を指し、前記相互作用は染色体の領域の状態に依存して動的であり、改変、形成または破壊される。
Epigenetic Interactions Related to the Invention As used herein, the terms "epigenetic" and "chromosomal" interactions typically refer to interactions between the distal regions of a chromosome. , The interaction is dynamic depending on the state of the chromosomal region and is modified, formed or destroyed.

本発明の特定のプロセスでは、染色体相互作用は、その相互作用の一部である染色体の両方の領域からの配列を含む連結核酸を最初に作製することによって検出される。そのようなプロセスにおいて、これらの領域は、任意の適切な手段によって架橋することができる。好ましい実施形態では、相互作用はホルムアルデヒドを用いて架橋されるが、任意のアルデヒド、またはD-ビオチノイル-e-アミノカプロン酸-N-ヒドロキシスクシンイミドエステルまたはジゴキシゲニン-3-O-メチルカルボニル-e-アミノカプロン酸-N-ヒドロキシスクシンイミドエステルによっても架橋することができる。パラ-ホルムアルデヒドは、4オングストローム離れたDNA鎖を架橋することができる。 In a particular process of the invention, chromosomal interactions are detected by first making linked nucleic acids containing sequences from both regions of the chromosome that are part of that interaction. In such a process, these regions can be crosslinked by any suitable means. In a preferred embodiment, the interaction is cross-linked with formaldehyde, but with any aldehyde, or D-biotinoyl-e-aminocaproic acid-N-hydroxysuccinimide ester or digoxygenin-3-O-methylcarbonyl-e-aminocaproic acid. It can also be crosslinked with -N-hydroxysuccinimide ester. Para-formaldehyde can crosslink DNA strands 4 angstroms apart.

染色体相互作用は、染色体領域の状態、例えば、それが生理学的状態の変化に応答して転写または抑制されているかどうかを反映し得る。本明細書で規定されるサブグループに特異的な染色体相互作用は安定であることが判明しており、したがって2つのサブグループ間の差異を測定する信頼できる手段を提供する。 Chromosomal interactions can reflect the state of a chromosomal region, eg, whether it is transcribed or repressed in response to changes in physiological state. The subgroup-specific chromosomal interactions defined herein have been found to be stable and thus provide a reliable means of measuring differences between the two subgroups.

さらに、特徴(疾患状態など)に特異的な染色体相互作用は、例えば、メチル化またはヒストンタンパク質の結合への変化のような他のエピジェネティックマーカーと比較して、通常生物学的過程の初期に生じる。したがって、本発明のプロセスは、生物学的過程の早期ステージを検出することができる。これにより、結果としてより効果的な早期介入(例えば治療)が可能になる。さらに、同じサブグループ内の個体間の関連する染色体相互作用にはほとんど変動がない。染色体相互作用を検出することは、遺伝子あたり50種までの異なる相互作用候補によって非常に有益であり、したがって、本発明のプロセスは500,000種の異なる相互作用を調べることができる。 In addition, characteristic (such as disease state) chromosomal interactions are usually early in the biological process compared to other epigenetic markers such as methylation or changes to histone protein binding. Occurs. Therefore, the processes of the present invention can detect early stages of biological processes. This results in more effective early intervention (eg, treatment). Moreover, there is little variation in the associated chromosomal interactions between individuals within the same subgroup. Detecting chromosomal interactions is very beneficial with up to 50 different interaction candidates per gene, so the process of the invention can examine 500,000 different interactions.

好ましいマーカーセット
特定のマーカーが本明細書において開示され、そのいずれも本発明において使用することができる。さらにマーカーのセット、例えば、本明細書に開示される組み合わせまたは数を使用することができる。マーカーセット1、2および3が好ましい。これらは、qPCR法を含む任意の適切な方法、例えば、本明細書に開示されるPCRまたはプローブに基づく方法によって型付けすることができる。マーカーは、本明細書において、位置またはプローブおよび/またはプライマー配列によって定義される。
Preferred Marker Set Specific markers are disclosed herein and any of them can be used in the present invention. In addition, a set of markers, eg, combinations or numbers disclosed herein, can be used. Marker sets 1, 2 and 3 are preferred. These can be typed by any suitable method, including the qPCR method, eg, PCR or probe-based methods disclosed herein. Markers are defined herein by position or probe and / or primer sequence.

エピジェネティック相互作用の位置と原因
エピジェネティック染色体相互作用は、関連する遺伝子または記載されていない遺伝子をコードすることが示されている染色体の領域に重複していてもよく、これを含み得るが、同様に遺伝子間領域に存在することもある。さらに、本発明者らが、すべての領域におけるエピジェネティック相互作用が、染色体座の状態を判定する上で等しく重要であることを発見したことに留意すべきである。これらの相互作用は、必ずしも遺伝子座に位置する特定の遺伝子のコード領域に存在するものではなく、遺伝子間領域に存在してもよい。
Locations and Causes of Epigenetic Interactions Epigenetic chromosomal interactions may, and may include, overlap with regions of the chromosome that have been shown to encode related or undescribed genes, although It may also be present in the intergenic region. Furthermore, it should be noted that we have found that epigenetic interactions in all regions are equally important in determining the status of chromosomal loci. These interactions do not necessarily exist in the coding region of a specific gene located at the locus, but may exist in the intergenic region.

本発明で検出される染色体相互作用は、基礎となるDNA配列の変化、環境因子、DNAメチル化、非コードアンチセンスRNA転写産物、非突然変異誘発性発癌物質、ヒストン修飾、クロマチンリモデリングおよび特異的局所DNA相互作用によって引き起こされ得る。染色体相互作用をもたらす変化は、それ自体が遺伝子産物または遺伝子発現の様式に直接影響しない、基礎となる核酸配列の変化によって引き起こされ得る。そのような変化は、例えば、遺伝子の内部および/または外部のSNP、遺伝子融合および/または遺伝子間DNA、マイクロRNA、および非コードRNAの欠失であり得る。例えば、約20%のSNPが非コード領域にあることが知られており、したがって、記載されたプロセスは非コードの場所においても有益である。一実施形態では、一体となって相互作用を形成する染色体の領域は、同じ染色体上で5kb、3kb、1kb、500塩基対または200塩基対未満離れている。 The chromosomal interactions detected in the present invention include changes in the underlying DNA sequence, environmental factors, DNA methylation, non-coding antisense RNA transcripts, non-mutation-induced carcinogens, histone modifications, chromatin remodeling and specificity. It can be caused by local DNA interactions. Changes that result in chromosomal interactions can be caused by changes in the underlying nucleic acid sequence that do not themselves directly affect the gene product or mode of gene expression. Such changes can be, for example, deletions of internal and / or external SNPs, gene fusions and / or intergenic DNAs, microRNAs, and non-coding RNAs of the gene. For example, it is known that about 20% of SNPs are in the non-coding region, and therefore the described process is also useful in the non-coding location. In one embodiment, the regions of the chromosome that together form an interaction are 5 kb, 3 kb, 1 kb, 500 base pairs or less than 200 base pairs apart on the same chromosome.

検出される染色体相互作用は、好ましくは、表9に記載の遺伝子のいずれかの内に存在する。検出される染色体相互作用は、マーカーセット1、2または3について記載の遺伝子のいずれかの内に存在する。しかし、それは、遺伝子の上流または下流、例えば遺伝子またはコード配列から最大50,000、最大30,000、最大20,000、最大10,000または最大5000塩基上流または下流にあってもよい。 The chromosomal interaction detected is preferably present within any of the genes listed in Table 9. The chromosomal interactions detected are within any of the genes described for marker sets 1, 2 or 3. However, it may be upstream or downstream of a gene, eg, up to 50,000, up to 30,000, up to 20,000, up to 10,000 or up to 5,000 bases upstream or downstream from a gene or coding sequence.

サブグループ、診断およびパーソナル化治療
本発明の目的は、乳がんサブグループに関連する染色体相互作用の検出を可能にすることである。したがって、このプロセスは、乳がんの診断に使用されても、または使用されなくてもよい。本発明のプロセスは、悪性乳がんの診断に使用することができ、好ましくはマーカーセット3からのマーカーがこのような実施形態に使用される。
Subgroups, Diagnosis and Personalized Treatment An object of the present invention is to enable the detection of chromosomal interactions associated with breast cancer subgroups. Therefore, this process may or may not be used in the diagnosis of breast cancer. The process of the present invention can be used in the diagnosis of malignant breast cancer, preferably markers from marker set 3 are used in such embodiments.

本明細書で使用される場合、「サブグループ」は、好ましくは集団のサブグループ(集団内のサブグループ)、より好ましくは特定の動物、例えば特定の真核生物または哺乳動物(例えば、ヒト、非ヒト、非ヒト霊長類またはげっ歯類、例えばマウスもしくはラット)の集団内のサブグループを指す。最も好ましくは、「サブグループ」は、ヒト集団のサブグループを指す。 As used herein, a "subgroup" is preferably a subgroup of a population (a subgroup within a population), more preferably a particular animal, such as a particular eukaryote or mammal (eg, a human,). Refers to a subgroup within a population of non-humans, non-human primates or rodents (eg, mice or rats). Most preferably, "subgroup" refers to a subgroup of the human population.

本発明は、集団内の特定のサブグループの検出および治療を含む。本発明者らは、所与の集団において、染色体相互作用がサブセット(例えば、2つまたは少なくとも2つのサブセット)の間で異なることを発見した。これらの違いを同定することで、医師は彼らの患者を、本プロセスに記載の集団の1つのサブセットの一部として分類することができる。したがって、本発明は、エピジェネティック染色体相互作用に基づいて、患者に対する医療をパーソナル化するプロセスを医師に提供する。 The invention includes the detection and treatment of specific subgroups within a population. We have found that in a given population, chromosomal interactions differ between subsets (eg, two or at least two subsets). By identifying these differences, physicians can classify their patients as part of one subset of the population described in this process. Accordingly, the present invention provides physicians with a process of personalizing medical care for patients based on epigenetic chromosomal interactions.

連結核酸の生成
本発明の特定の実施形態は、連結された核酸、特に連結されたDNAを利用する。これらは、染色体相互作用において一体となる両方の領域からの配列を含み、したがって相互作用に関する情報を提供する。本明細書に記載のEpiSwitch(商標)法は、そのような連結核酸の生成を使用して、染色体相互作用を検出する。
Generation of Linked Nucleic Acids Certain embodiments of the invention utilize linked nucleic acids, especially linked DNA. These include sequences from both regions that are united in the chromosomal interaction and thus provide information about the interaction. The EpiSwitch ™ method described herein uses the production of such linked nucleic acids to detect chromosomal interactions.

したがって、本発明のプロセスは、以下の工程(これらの工程を含む方法を含む):
(i)染色体座に存在するエピジェネティック染色体相互作用を、好ましくはインビトロで架橋する工程;
(ii)任意に架橋DNAを前記染色体座から単離する工程;
(iii)前記架橋DNAに、例えば少なくとも1回切断する酵素(特に、前記染色体座内で少なくとも1回切断する酵素)による制限消化によって切断を施す工程;
(iv)前記架橋切断DNA末端を、(特にDNAループを形成するために)連結する工程;ならびに
(v)任意に、前記連結DNAおよび/または前記DNAループの存在を、特にPCR(ポリメラーゼ連鎖反応)のような技術を用いて同定して、特異的な染色体相互作用の存在を同定する工程、
によって、連結核酸(例えば、DNA)を生成する工程を含むことができる。
Therefore, the process of the present invention includes the following steps (including methods including these steps):
(I) A step of cross-linking epigenetic chromosomal interactions present at chromosomal loci, preferably in vitro;
(Ii) Arbitrarily a step of isolating the crosslinked DNA from the chromosomal locus;
(Iii) A step of cleaving the crosslinked DNA by restriction digestion with, for example, an enzyme that cleaves at least once (particularly, an enzyme that cleaves at least once in the chromosomal locus);
(Iv) The step of linking the crosslinked DNA ends (especially to form a DNA loop); and (v) optionally, the presence of the linked DNA and / or the DNA loop, in particular PCR (polymerase chain reaction). ), The process of identifying the presence of specific chromosomal interactions,
Can include the step of producing a ligated nucleic acid (eg, DNA).

これらの工程を実施して、本明細書に記載の任意の実施形態のために、例えば、個体が乳がんサブグループの一部であるかどうかを判定するために染色体相互作用を検出することができる。また、この工程を実施して、本明細書に記載の第1および/または第2の核酸セットを生成することができる。 These steps can be performed to detect chromosomal interactions for any of the embodiments described herein, eg, to determine if an individual is part of a breast cancer subgroup. .. This step can also be performed to produce the first and / or second nucleic acid sets described herein.

PCR(ポリメラーゼ連鎖反応)を使用して、連結核酸を検出または同定することができる。例えば、産生されるPCR産物のサイズは、存在する特異的な染色体相互作用を示すことができ、遺伝子座の状態を同定するために使用することができる。好ましい実施形態では、表10に示す少なくとも1、2、3、4、5、6、7または8種のプライマーまたはプライマー対がPCR反応に使用される。他の好ましい実施形態では、マーカーセット2もしくは3に関連するか、またはこれらについて示される少なくとも1、2、3、4、5、6、7または8種のプライマーまたはプライマー対が、PCR反応に使用される。当業者は、目的の染色体座内でDNAを切断するために使用され得る多数の制限酵素を認識していると思われる。使用される特定の酵素が、研究される遺伝子座およびその中に位置するDNAの配列に依存することは明らかであろう。本発明に記載のDNAを切断するために使用できる制限酵素の非限定的な例は、TaqIである。 PCR (Polymerase Chain Reaction) can be used to detect or identify linked nucleic acids. For example, the size of the PCR product produced can indicate the specific chromosomal interactions that are present and can be used to identify the state of the locus. In a preferred embodiment, at least 1, 2, 3, 4, 5, 6, 7 or 8 primers or primer pairs shown in Table 10 are used in the PCR reaction. In other preferred embodiments, at least 1, 2, 3, 4, 5, 6, 7 or 8 primers or primer pairs associated with or indicated for marker sets 2 or 3 are used in the PCR reaction. Will be done. Those of skill in the art appear to be aware of a number of restriction enzymes that can be used to cleave DNA within the locus of interest. It will be clear that the particular enzyme used depends on the locus being studied and the sequence of DNA located therein. A non-limiting example of a restriction enzyme that can be used to cleave the DNA described in the present invention is TaqI.

EpiSwitch(商標)技術などの実施形態
EpiSwitch(商標)技術はまた、表現型に特異的なエピジェネティックな染色体コンフォメーションシグネチャーの検出におけるマイクロアレイEpiSwitch(商標)マーカーデータの使用に関連する。本明細書に記載の様式で連結核酸を利用するEpiSwitch(商標)などの実施形態は、いくつかの利点を有する。例えば、本発明の第1の核酸セットからの核酸配列は、第2の核酸セットとハイブリダイズするか、またはハイブリダイズできないかのいずれかであるため、それらは確率的雑音のレベルが低い。これは、エピジェネティックレベルで複雑な機序を測定する比較的簡単な方法を可能にするバイナリ結果を提供する。EpiSwitch(商標)技術はまた、処理時間が短く、コストが低い。一実施形態では、処理時間は3時間~6時間である。
Embodiments such as EpiSwitch ™ technology EpiSwitch ™ technology also relates to the use of microarray EpiSwitch ™ marker data in the detection of phenotype-specific epigenetic chromosomal conformational signatures. Embodiments such as EpiSwitch ™ that utilize linked nucleic acids in the manner described herein have several advantages. For example, the nucleic acid sequences from the first nucleic acid set of the invention either hybridize with or cannot hybridize with the second nucleic acid set, so that they have a low level of stochastic noise. It provides binary results that allow a relatively simple way to measure complex mechanisms at the epigenetic level. EpiSwitch ™ technology also has short processing times and low costs. In one embodiment, the processing time is 3 to 6 hours.

サンプルおよびサンプル処理
本発明のプロセスは、通常、サンプルに対して実施される。サンプルは通常、個体由来のDNAを含む。それには通常細胞が含まれる。一実施形態では、サンプルは最小の侵襲的手段によって得られ、例えば血液サンプルであり得る。DNAを抽出し、標準的な制限酵素で切断することができる。これにより、EpiSwitch(商標)プラットフォームでどの染色体コンフォメーションが保持され、検出されるかを事前に判定できる。水平伝播を含む組織と血液との間の染色体相互作用の同調により、血液サンプルを使用して、疾患に関連する組織などの組織における染色体相互作用を検出することができる。癌などの特定の状態では、突然変異による遺伝的雑音は、関連する組織における染色体相互作用「シグナル」に影響を及ぼすことがあり、したがって、血液を用いることが有利である。
Samples and Sample Processing The process of the present invention is typically performed on samples. Samples usually contain DNA of individual origin. It usually involves cells. In one embodiment, the sample is obtained by minimally invasive means and can be, for example, a blood sample. DNA can be extracted and cleaved with standard restriction enzymes. This allows it to predetermine which chromosomal conformation is retained and detected on the EpiSwitch ™ platform. Synchronization of chromosomal interactions between tissue and blood, including horizontal transmission, allows blood samples to be used to detect chromosomal interactions in tissues such as disease-related tissues. In certain conditions, such as cancer, genetic noise due to mutations can affect chromosomal interaction "signals" in the tissues involved, and therefore it is advantageous to use blood.

本発明の核酸の特性
本発明は、本発明のプロセスにおいて使用または生成されるものとして本明細書に記載される連結核酸などの特定の核酸に関する。これらは、本明細書に記載の第1および第2の核酸と同じであっても、またはそれらの特性のいずれかを有してもよい。本発明の核酸は、典型的には、染色体相互作用において一体となる染色体の2つの領域のうちの一方に由来する配列をそれぞれが含む2つの部分を含む。典型的には、各部分は、長さが少なくとも8、10、15、20、30または40ヌクレオチド長、例えば10~40ヌクレオチド長である。好ましい核酸は、いずれかの表に記載のいずれかの遺伝子に由来する配列を含む。典型的には、好ましい核酸は、表9に記載の特異的プローブ配列、またはそのような配列の断片および/またはホモログを含む。典型的には、好ましい核酸は、マーカーセット2もしくは3に関連する、および/またはこれらについて記載される特異的プローブ配列、またはそのような配列の断片および/またはホモログを含む。好ましくは、核酸はDNAである。特異的配列が提供される場合、本発明は、特定の実施形態において必要に応じて相補的配列を使用し得ることは理解されよう。
Nucleic Acid Properties of the Invention The invention relates to specific nucleic acids, such as the linked nucleic acids described herein as being used or produced in the process of the invention. These may be the same as the first and second nucleic acids described herein, or may have any of their properties. The nucleic acids of the invention typically contain two moieties, each containing a sequence derived from one of two regions of the chromosome that are integrated in a chromosomal interaction. Typically, each moiety is at least 8, 10, 15, 20, 30 or 40 nucleotides in length, eg, 10-40 nucleotides in length. Preferred nucleic acids include sequences derived from any of the genes listed in any of the tables. Typically, preferred nucleic acids include the specific probe sequences listed in Table 9, or fragments and / or homologs of such sequences. Typically, preferred nucleic acids include specific probe sequences associated with and / or described for marker sets 2 or 3, or fragments and / or homologs of such sequences. Preferably, the nucleic acid is DNA. It will be appreciated that if a specific sequence is provided, the invention may use complementary sequences as needed in a particular embodiment.

表10に示されるプライマーはまた、本明細書に記載の本発明において使用することができる。一実施形態では、表10に示す配列、または表10に示す任意の配列の断片および/またはホモログのいずれかを含むプライマーが使用される。マーカーセット2もしくは3に関連する、および/またはこれらについて示されるプライマーもまた、本明細書に記載の本発明において使用することができる。一実施形態では、マーカーセット2もしくは3にについて示される配列、またはマーカーセット2もしくは3について示される任意の配列の断片および/またはホモログのいずれかを含むプライマーが使用される。 The primers shown in Table 10 can also be used in the present invention as described herein. In one embodiment, primers comprising either the sequences shown in Table 10 or fragments and / or homologs of any of the sequences shown in Table 10 are used. Primers associated with and / or indicated for marker sets 2 or 3 can also be used in the present invention as described herein. In one embodiment, a primer comprising either the sequence shown for marker set 2 or 3 or a fragment and / or homolog of any sequence shown for marker set 2 or 3 is used.

第2の核酸セット-「指標」配列
第2の核酸配列セットは、指標配列のセットであるという機能を有し、本質的に、サブグループ特異的配列を同定するのに適した核酸配列のセットである。それらは、「バックグラウンド」染色体相互作用を表すことができ、何らかの方法で選択することができ、または選択されなくてもよい。それらは一般的にすべての染色体相互作用候補のサブセットである。
Second Nucleic Acid Set- "Index" Sequence The second nucleic acid sequence set has the function of being a set of index sequences and is essentially a set of nucleic acid sequences suitable for identifying subgroup-specific sequences. Is. They can represent "background" chromosomal interactions and can or may not be selected in any way. They are generally a subset of all chromosomal interaction candidates.

第2の核酸セットは、任意の適切なプロセスによって得ることができる。それらはコンピュータにより導くことができ、または個体における染色体相互作用に基づくこともできる。それらは、典型的には、第1の核酸セットよりも大きな集団群を表す。特定の一実施形態では、第2の核酸セットは、遺伝子の特異的セットにおけるすべてのエピジェネティック染色体相互作用候補を表す。別の特定の実施形態では、第2の核酸セットは、本明細書に記載の集団に存在するすべてのエピジェネティック染色体相互作用候補の大部分を表す。特定の一実施形態では、第2の核酸セットは、少なくとも20、50、100または500種の遺伝子、例えば20~100または50~500種の遺伝子におけるエピジェネティック染色体相互作用の少なくとも50%または少なくとも80%を表す。 The second set of nucleic acids can be obtained by any suitable process. They can be computer-derived or can be based on chromosomal interactions in the individual. They typically represent a larger population group than the first set of nucleic acids. In one particular embodiment, the second set of nucleic acids represents all epigenetic chromosomal interaction candidates in a specific set of genes. In another particular embodiment, the second set of nucleic acids represents the majority of all epigenetic chromosomal interaction candidates present in the population described herein. In one particular embodiment, the second nucleic acid set is at least 50% or at least 80 of epigenetic chromosomal interactions in at least 20, 50, 100 or 500 genes, such as 20-100 or 50-500 genes. Represents%.

第2の核酸セットは、典型的には、集団における疾患状態/表現型を改変、調節、または任意の方法で媒介する少なくとも100種のエピジェネティック染色体相互作用候補を表す。第2の核酸セットは、種における疾患状態に影響を及ぼす染色体相互作用、例えば、任意の疾患状態、疾患の素因または疾患表現型に関連するサイトカイン、キナーゼまたは調節因子をコードする遺伝子における染色体相互作用を表すことができる。第2の核酸セットは、典型的には、乳がんサブグループに関連する、および関連しないエピジェネティック相互作用を表す配列を含む。 The second set of nucleic acids typically represents at least 100 potential epigenetic chromosomal interactions that modify, regulate, or otherwise mediate disease state / phenotype in the population. The second set of nucleic acids is a chromosomal interaction in a gene encoding a cytokine, kinase or regulator associated with a disease state in a species, eg, any disease state, disease predisposition or disease phenotype. Can be represented. The second set of nucleic acids typically comprises sequences representing epigenetic interactions associated with and unrelated to breast cancer subgroups.

特定の一実施形態では、第2の核酸セットは、集団において天然に生じる配列から少なくとも部分的に誘導され、典型的にはインシリコプロセスによって得られる。前記核酸は、天然に生じる核酸中に存在する核酸の対応する部分と比較して、単一または複数の突然変異をさらに含み得る。突然変異には、1つまたは複数のヌクレオチド塩基対の欠失、置換および/または付加が含まれる。特定の一実施形態では、第2の核酸セットは、天然に生じる種に存在する核酸の対応する部分と少なくとも70%の配列同一性を有するホモログおよび/またはオルソログを表す配列を含み得る。別の特定の実施形態では、天然に生じる種に存在する核酸の対応する部分と少なくとも80%の配列同一性または少なくとも90%の配列同一性が提供される。 In one particular embodiment, the second set of nucleic acids is at least partially derived from naturally occurring sequences in the population and is typically obtained by in silico processes. The nucleic acid may further contain a single or multiple mutations as compared to the corresponding portion of the nucleic acid present in the naturally occurring nucleic acid. Mutations include deletions, substitutions and / or additions of one or more nucleotide base pairs. In one particular embodiment, the second set of nucleic acids may include sequences representing homologs and / or orthologs that have at least 70% sequence identity with the corresponding portion of the nucleic acid present in the naturally occurring species. In another particular embodiment, at least 80% sequence identity or at least 90% sequence identity is provided with the corresponding portion of the nucleic acid present in the naturally occurring species.

第2の核酸セットの特性
特定の一実施形態では、第2の核酸セットには少なくとも100種の異なる核酸配列、好ましくは少なくとも1000、2000または5000種の異なる核酸配列、最大100,000、1,000,000または10,000,000種の異なる核酸配列が存在する。典型的な数は、100~1,000,000種、例えば1,000~100,000種の異なる核酸配列がある。すべてまたは少なくとも90%または少なくとも50%またはこれらが異なる染色体相互作用に対応すると思われる。
Characteristics of Second Nucleic Acid Set In one particular embodiment, the second nucleic acid set contains at least 100 different nucleic acid sequences, preferably at least 1000, 2000 or 5000 different nucleic acid sequences, up to 100,000, 1,. There are 1,000,000 or 1,000,000 different nucleic acid sequences. Typical numbers are 100 to 1,000,000, for example 1,000 to 100,000 different nucleic acid sequences. All or at least 90% or at least 50% or these appear to correspond to different chromosomal interactions.

特定の一実施形態では、第2の核酸セットは、少なくとも20種の異なる遺伝子座または遺伝子、好ましくは少なくとも40種の異なる遺伝子座または遺伝子、さらに好ましくは少なくとも100、少なくとも500、少なくとも1000または少なくとも5000種の遺伝子座または遺伝子、例えば100~10,000種の異なる遺伝子座または遺伝子における染色体相互作用を表す。第2の核酸セットの長さは、ワトソンクリック塩基対形成に従って第1の核酸セットと特異的にハイブリダイズして、サブグループに特異的な染色体相互作用の同定を可能にするために適している。典型的には、第2の核酸セットは、染色体相互作用において一体となる2つの染色体領域に対応する配列中の2つの部分を含む。第2の核酸セットは、典型的には、少なくとも10、好ましくは20、および好ましくは30塩基(ヌクレオチド)長の核酸配列を含む。別の実施形態では、核酸配列は、多くとも500塩基対、好ましくは多くとも100塩基対、さらに好ましくは多くとも50塩基対の長さであり得る。好ましい実施形態では、第2の核酸セットは、17~25塩基対の核酸配列を含む。一実施形態では、第2の核酸配列セットの少なくとも100、80%または50%が上記の長さを有する。好ましくは、異なる核酸はいかなる重複配列も有さず、例えば核酸の少なくとも100%、90%、80%または50%が、少なくとも5個の連続したヌクレオチドにわたって同じ配列を有さない。 In one particular embodiment, the second set of nucleic acids is at least 20 different loci or genes, preferably at least 40 different loci or genes, more preferably at least 100, at least 500, at least 1000 or at least 5000. Represents a chromosomal interaction at a species locus or gene, eg, 100-10,000 different loci or genes. The length of the second nucleic acid set is suitable to specifically hybridize with the first nucleic acid set according to Watson-Crick base pairing, allowing identification of subgroup-specific chromosomal interactions. .. Typically, the second set of nucleic acids comprises two parts of the sequence corresponding to the two chromosomal regions that are united in the chromosomal interaction. The second nucleic acid set typically comprises at least 10, preferably 20, and preferably 30 base (nucleotide) long nucleic acid sequences. In another embodiment, the nucleic acid sequence can be at most 500 base pairs, preferably at most 100 base pairs, and even more preferably at most 50 base pairs. In a preferred embodiment, the second nucleic acid set comprises a 17-25 base pair nucleic acid sequence. In one embodiment, at least 100, 80% or 50% of the second nucleic acid sequence set has the above length. Preferably, the different nucleic acids do not have any overlapping sequences, for example at least 100%, 90%, 80% or 50% of the nucleic acids do not have the same sequence over at least 5 contiguous nucleotides.

第2の核酸セットが「指標」として作用することを考慮すると、同じ第2の核酸セットを、特徴の異なるサブグループを表すさまざまな第1の核酸セットと共に使用することができ、すなわち、第2の核酸セットは、異なる特徴に関連する染色体相互作用を同定するために使用することができる核酸の「ユニバーサル(universal)」コレクションであり得る。 Considering that the second nucleic acid set acts as an "index", the same second nucleic acid set can be used with various first nucleic acid sets representing subgroups with different characteristics, i.e., the second. Nucleic acid sets can be a "universal" collection of nucleic acids that can be used to identify chromosomal interactions associated with different features.

第1の核酸セット
第1の核酸セットは、通常、乳がんを有する個体由来である。第1の核酸は、本明細書に記載の第2の核酸セットの特徴および特性のいずれかを有することができる。第1の核酸セットは、通常、本明細書に記載の治療および処理、特にEpiSwitch(商標)の架橋および切断工程を受けた個体由来のサンプルである。典型的には、第1の核酸セットは、個体から採取されたサンプル中に存在する染色体相互作用のすべて、または少なくとも80%もしくは50%を表す。
First Nucleic Acid Set The first nucleic acid set is usually from an individual with breast cancer. The first nucleic acid can have any of the characteristics and properties of the second nucleic acid set described herein. The first nucleic acid set is typically a sample from an individual that has undergone the treatments and treatments described herein, in particular the cross-linking and cleavage steps of EpiSwitch ™. Typically, the first set of nucleic acids represents all, or at least 80% or 50%, of the chromosomal interactions present in the sample taken from the individual.

典型的には、核酸の第1のセットは、第2の核酸セットによって表される染色体相互作用と比較して、第2の核酸セットによって表される遺伝子座または遺伝子にわたる染色体相互作用のより小さい集団を表す、すなわち第2の核酸セットは遺伝子座または遺伝子の規定セットにおける相互作用のバックグラウンドまたは指標セットを表す。 Typically, the first set of nucleic acids is smaller than the chromosomal interactions across loci or genes represented by the second set of nucleic acids compared to the chromosomal interactions represented by the second set of nucleic acids. Representing a population, i.e., a second set of nucleic acids represents a background or index set of interactions in a locus or a defined set of genes.

核酸ライブラリー
本明細書に記載の核酸集団のタイプのいずれかは、そのタイプ、例えば「第1」または「第2」の核酸の少なくとも200、少なくとも500、少なくとも1000、少なくとも5000または少なくとも10000の異なる核酸を含むライブラリーの形態で存在し得る。そのようなライブラリーは、アレイに結合された形態であり得る。
Nucleic Acid Library Any of the types of nucleic acid populations described herein may differ from that type, eg, at least 200, at least 500, at least 1000, at least 5000 or at least 10000 of the "first" or "second" nucleic acids. It can exist in the form of a library containing nucleic acids. Such a library can be in an array-bound form.

ハイブリダイゼーション
本発明は、第1の核酸セットおよび第2の核酸セットからの全体的または部分的に相補的な核酸配列がハイブリダイズ可能となる手段を必要とする。一実施形態では、第1の核酸セットのすべてを第2の核酸セットのすべてと、単一のアッセイ、すなわち単一のハイブリダイゼーション工程において接触させる。しかしながら、任意の適切なアッセイを使用することができる。
Hybridization The present invention requires means by which whole or partially complementary nucleic acid sequences from the first and second nucleic acid sets can be hybridized. In one embodiment, all of the first set of nucleic acids is contacted with all of the second set of nucleic acids in a single assay, i.e., a single hybridization step. However, any suitable assay can be used.

標識された核酸およびハイブリダイゼーションのパターン
本明細書に記載の核酸は、好ましくは、成功したハイブリダイゼーションの検出を補助するフルオロフォア(蛍光分子)または放射性標識のような独立した標識を用いて標識することができる。特定の標識は、UV光の下で検出することができる。例えば本明細書に記載のアレイ上のハイブリダイゼーションのパターンは、2つのサブグループ間のエピジェネティック染色体相互作用の差異を表し、したがって、エピジェネティック染色体相互作用を比較し、どのエピジェネティック染色体相互作用が本発明の集団のサブグループに特異的であるかを判定するプロセスを提供する。
Labeled Nucleic Acids and Hybridization Patterns The nucleic acids described herein are preferably labeled with an independent label such as a fluorophore (fluorophore) or radioactive label that aids in the detection of successful hybridization. be able to. Certain labels can be detected under UV light. For example, the patterns of hybridization on the arrays described herein represent differences in epigenetic chromosomal interactions between the two subgroups, thus comparing epigenetic chromosomal interactions and which epigenetic chromosomal interactions are. Provided is a process of determining whether a subgroup of the group of the present invention is specific.

「ハイブリダイゼーションのパターン」という用語は、第1の核酸セットと第2の核酸セットとの間のハイブリダイゼーションの有無、すなわち、第1セットからのどの特異的核酸が第2セットからのどの特異的核酸とハイブリダイズするかを広範囲に含み、任意の特定のアッセイもしくは技術、または「パターン」が検出され得る表面もしくはアレイを有する必要性に限定されない。 The term "hybridization pattern" refers to the presence or absence of hybridization between a first set of nucleic acids and a second set of nucleic acids, i.e., which specific nucleic acid from the first set is specific to which from the second set. It includes broadly including whether to hybridize with nucleic acids and is not limited to the need to have any particular assay or technique, or surface or array from which a "pattern" can be detected.

特定の特徴を持つサブグループの選択
本発明は、個体において乳がんに関連する特徴の有無を判定するために、典型的には5~20または5~500種のそのような相互作用、好ましくは20~300または50~100種の相互作用の有無を検出する工程を含むプロセスを提供する。好ましくは、染色体相互作用は、本明細書に記載の遺伝子のいずれかにおけるものである。一実施形態では、型付けされる染色体相互作用は、表9の核酸によって表されるものである。表9の「検出されたループ」と題された列は、各プローブによってどのサブグループ(乳がんまたは対照)が検出されたかを示す。図からわかるように、本発明のプロセスは、試験の一部として、乳がんサブグループおよび/または対照サブグループ(非乳がん)のいずれかを検出することができる。
Selection of Subgroups with Specific Characteristics The present invention typically comprises 5 to 20 or 5 to 500 such interactions, preferably 20 to determine the presence or absence of breast cancer-related characteristics in an individual. Provided is a process comprising the step of detecting the presence or absence of ~ 300 or 50-100 kinds of interactions. Preferably, the chromosomal interaction is in any of the genes described herein. In one embodiment, the chromosomal interactions typed are those represented by the nucleic acids in Table 9. The column entitled "Detected Loops" in Table 9 shows which subgroup (breast cancer or control) was detected by each probe. As can be seen from the figure, the process of the invention can detect either the breast cancer subgroup and / or the control subgroup (non-breast cancer) as part of the study.

被験個体
被験個体が由来する種の例は、本明細書に記載されている。さらに、本発明の方法における被験個体は、何らかのプロセスで選択されていてよい。例えば、個体は女性であってよい。
Subject Individuals Examples of species from which subject individuals are derived are described herein. Furthermore, the test individual in the method of the present invention may be selected by some process. For example, the individual may be female.

好ましい遺伝子領域、遺伝子座、遺伝子および染色体相互作用
本発明のすべての態様のための、好ましい遺伝子領域、遺伝子座、遺伝子および染色体相互作用が表9に記載されている。典型的には、本発明のプロセスでは、染色体相互作用は、表9に列挙された関連遺伝子の少なくとも1、2、3、4、5、6、7または8種から検出される。好ましくは、表9のプローブ配列によって表される関連する特異的染色体相互作用の少なくとも1、2、3、4、5、6、7または8種の有無が検出される。疾患関連領域は、本明細書に記載の遺伝子のいずれかの上流または下流、例えば、コード配列から50kb上流または20kb下流にあり得る。
Preferred Gene Regions, Loci, Genes and Chromosome Interactions Table 9 shows preferred gene regions, loci, genes and chromosomal interactions for all aspects of the invention. Typically, in the process of the invention, chromosomal interactions are detected in at least 1, 2, 3, 4, 5, 6, 7 or 8 of the related genes listed in Table 9. Preferably, the presence or absence of at least 1, 2, 3, 4, 5, 6, 7 or 8 of the relevant specific chromosomal interactions represented by the probe sequences in Table 9 is detected. The disease-related region can be upstream or downstream of any of the genes described herein, eg, 50 kb upstream or 20 kb downstream from the coding sequence.

本発明のすべての態様のための、好ましい遺伝子領域、遺伝子座、遺伝子および染色体相互作用は他の表にも記載されている。典型的には、本発明のプロセスでは、染色体相互作用は、例えばマーカーセット2または3にについて表に列挙された関連遺伝子の少なくとも1、2、3、4、5、6、7または8種から検出される。好ましくは、表中のプローブ配列によって表される関連する特異的染色体相互作用の少なくとも1、2、3、4、5、6、7または8種の有無が検出される。疾患関連領域は、本明細書に記載の遺伝子のいずれかの上流または下流、例えば、コード配列から50kb上流または20kb下流にあり得る。 Preferred gene regions, loci, genes and chromosomal interactions for all aspects of the invention are also described in other tables. Typically, in the process of the invention, chromosomal interactions are from at least 1, 2, 3, 4, 5, 6, 7 or 8 of the related genes listed in the table, eg for marker set 2 or 3. Detected. Preferably, the presence or absence of at least 1, 2, 3, 4, 5, 6, 7 or 8 of the relevant specific chromosomal interactions represented by the probe sequences in the table is detected. The disease-related region can be upstream or downstream of any of the genes described herein, eg, 50 kb upstream or 20 kb downstream from the coding sequence.

一実施形態では、遺伝子座(染色体相互作用が検出される遺伝子および/または場所を含む)は、CTCF結合部位を含み得る。これは、転写リプレッサーCTCFに結合することができる任意の配列である。その配列は、その遺伝子座に1、2または3コピー存在し得る配列CCCTCからなるか、またはそれを含み得る。CTCF結合部位配列は、配列CCGCGNGGNGGCAG(IUPAC表記法)を含み得る。CTCF結合部位は、染色体相互作用の少なくとも100、500、1000または4000塩基以内または表9に示されるいずれかの染色体領域内にあり得る。CTCF結合部位は、染色体相互作用の少なくとも100、500、1000または4000塩基以内、または例えばマーカーセット2もしくは3についての任意の表に示されるいずれかの染色体領域内にあり得る。 In one embodiment, the locus, including the gene and / or location where the chromosomal interaction is detected, may include a CTCF binding site. This is any sequence that can bind to the transcriptional repressor CTCF. The sequence consists of or may contain the sequence CCCTC, which may have one, two or three copies at the locus. The CTCF binding site sequence may include the sequence CCCGCGNGGNGGCAG (IUPAC notation). The CTCF binding site can be within at least 100, 500, 1000 or 4000 bases of chromosomal interaction or within any of the chromosomal regions shown in Table 9. The CTCF binding site can be within at least 100, 500, 1000 or 4000 bases of chromosomal interaction, or within any chromosomal region shown in any table for, for example, marker set 2 or 3.

一実施形態では、検出される染色体相互作用は、表9に示される遺伝子領域のいずれかに存在する。連結された核酸が本プロセスで検出される場合、表9のプローブ配列のいずれかに示される配列が検出され得る。別の実施形態では、検出される染色体相互作用は、例えばマーカーセット2または3について他の表に示される遺伝子領域のいずれかに存在する。連結核酸が本プロセスで検出される場合、例えばマーカーセット2または3についての表中のプローブ配列のいずれかに示される配列が検出され得る。 In one embodiment, the chromosomal interaction detected is in any of the gene regions shown in Table 9. If the ligated nucleic acid is detected in this process, the sequence shown in any of the probe sequences in Table 9 can be detected. In another embodiment, the chromosomal interaction detected is, for example, in any of the gene regions shown in other tables for marker set 2 or 3. If the ligated nucleic acid is detected in this process, the sequence shown in any of the probe sequences in the table for, for example, marker set 2 or 3 can be detected.

したがって典型的には、プローブの両方の領域由来(すなわち、染色体相互作用の両方の部位由来)の配列を検出可能である。好ましい実施形態では、任意の表に示されるプローブと同一または相補的な配列を含むか、またはそれからなるプローブが本プロセスにおいて使用される。いくつかの実施形態では、表に示されるプローブ配列のいずれかと相同である配列を含むプローブが使用される。 Thus, typically, sequences from both regions of the probe (ie, from both sites of chromosomal interaction) can be detected. In a preferred embodiment, a probe comprising or consisting of the same or complementary sequence as any of the probes shown in any table is used in this process. In some embodiments, probes containing sequences that are homologous to any of the probe sequences shown in the table are used.

本明細書に提供される表
表9は、乳がんに関連する染色体相互作用を表すプローブ(Episwitch(商標)マーカー)データおよび遺伝子データを示す。他のプローブおよび遺伝子データは、例えばマーカーセット2または3についての他の表に示されている。プローブ配列は、染色体相互作用において一体となる遺伝子領域の両部位から生成された連結産物を検出するために使用できる配列を示し、すなわち、このプローブは、連結産物中の配列に相補的な配列を含む。第1の2セットの開始-終結位置はプローブ位置を示し、第2の2セットの開始-終結位置は関連する4kb領域を示す。プローブデータの表には、以下の情報が提供される。
-HyperG_Stats:超幾何濃縮のパラメータに基づいて、遺伝子座における有意なEpiSwitch(商標)マーカーの数を見出す確率についてのp値
-総プローブ数:遺伝子座において試験されたEpiSwitch(商標)コンフォメーションの総数
-有意なプローブ数:遺伝子座において統計的に有意であることが判明したEpiSwitch(商標)コンフォメーションの数
-FDR HyperG:多重検定(偽発見率)により補正された超幾何P値
-有意パーセント:遺伝子座において試験されたマーカーの数に対する有意なEpiSwitch(商標)マーカーのパーセンテージ
-logFC:エピジェネティック比(FC)の底を2とする対数
-平均発現:すべてのアレイとチャネルにわたるプローブの平均log2発現
-T:調整t統計量
-p値:生p値
-調整p値:調整されたp値またはq値
-B-B統計量(ロッズ(lods)またはB)は、その遺伝子が差次的に発現される対数オッズ(log-odds)である。
-FC-非対数倍数変化
-FC_1-ゼロを中心とした非対数倍数変化
-LS-FC_1値に関連するバイナリ値。FC_1の値が-1.1より小さい場合は-1に設定され、FC_1の値が1.1より大きい場合は1に設定される。それらの値の間ではこの値は0である。
Table 9 provided herein shows probe (Episwitch ™ marker) and genetic data representing chromosomal interactions associated with breast cancer. Other probes and genetic data are shown, for example, in other tables for marker sets 2 or 3. The probe sequence indicates a sequence that can be used to detect ligation products generated from both sites of the gene region that are integrated in the chromosomal interaction, ie, this probe is a sequence complementary to the sequence in the ligation product. include. The start-end position of the first two sets indicates the probe position and the start-end position of the second set indicates the associated 4 kb region. The probe data table provides the following information:
-HyperG_Stats: p-value for the probability of finding a significant number of EpiSwitch ™ markers at the locus based on the parameters of hypergeometric enrichment-Total number of probes: Total number of EpiSwitch ™ conformations tested at the locus -Significant probe count: Number of EpiSwitch ™ conformations found to be statistically significant at the loci-FDR HyperG: Supergeometric P-value corrected by multiplex test (false discovery rate) -Significant percentage: Significant EpiSwitch ™ marker percentage to the number of markers tested at the locus-logFC: log with a base of 2-epigenetic ratio (FC) -mean expression: mean log2 expression of the probe across all arrays and channels -T: Adjusted t statistic-p value: Raw p value-Adjusted p value: Adjusted p value or q value-BB statistic (rods or B) is that the gene is differential The log-odds expressed.
-FC-Non-log multiple change-FC_1-Zero-centered non-log multiple change-LS-Binary value associated with the FC_1 value. If the value of FC_1 is less than -1.1, it is set to -1, and if the value of FC_1 is larger than 1.1, it is set to 1. Among those values, this value is 0.

表9は、関連する染色体相互作用が起こることが判明した遺伝子を示す。他の表は同様のデータを示す。遺伝子座表のp値は、HyperG_Stats(超幾何濃縮のパラメータに基づいて遺伝子座における有意なEpiSwitch(商標)マーカーの数を見出す確率についてのp値)と同じである。 Table 9 shows the genes for which related chromosomal interactions have been found to occur. Other tables show similar data. The p-value in the locus is the same as HyperG_Stats, the p-value for the probability of finding a significant number of EpiSwitch ™ markers in a locus based on the parameters of hypergeometric enrichment.

プローブは、Taq1部位から30bp離して設計される。PCRの場合、PCRプライマーも、連結産物を検出するように設計されているが、Taq1部位からのそれらの位置は変動する。 The probe is designed 30 bp away from the Taq1 site. In the case of PCR, PCR primers are also designed to detect ligation products, but their position from the Taq1 site varies.

プローブの位置:
開始1-断片1のTaqI部位の30塩基上流
終結1-断片1のTaqI制限部位
開始2-断片2のTaqI制限部位
終結2-断片2のTaqI部位の30塩基下流
4kb配列の位置:
開始1-断片1のTaqI部位の4000塩基上流
終結1-断片1のTaqI制限部位
開始2-断片2のTaqI制限部位
終結2-断片2のTaqI部位の4000塩基下流
表10および他の表は、上位PCRマーカーそれぞれについて示す:GLMNET-lasso全体またはelastic-net正則化をフィッティングするための手順。ラムダを0.5に設定(elastic-net)
Probe position:
Start 2-30 bases upstream of TaqI site in fragment 1 Termination 1-TaqI restriction site in fragment 1 Start 2-TaqI restriction site in fragment 2 Termination 2-30 bases downstream of TaqI site in fragment 2 Position of 4kb sequence:
Start 2-4000 bases upstream of TaqI site of fragment 1 Termination 1-TaqI restriction site of fragment 1 Start 2-TaqI restriction site of fragment 2 Termination 2-4000 bases downstream of TaqI site of fragment 2 Table 10 and other tables are shown. For each of the top PCR markers: The procedure for fitting the entire GLMNET-lasso or elastic-net regularization. Set lambda to 0.5 (elastic-net)

サンプル調製および染色体相互作用検出のための好ましい実施形態
サンプルを調製し、染色体コンフォメーションを検出する方法を、本明細書に記載する。これらの方法の最適化された(非従来的な)バージョンを、例えばこの節に記載のように使用することができる。
Preferred Embodiments for Sample Preparation and Chromosome Interaction Detection Methods are described herein for preparing samples and detecting chromosomal conformations. Optimized (non-conventional) versions of these methods can be used, for example, as described in this section.

典型的には、サンプルは少なくとも2×10個の細胞を含む。サンプルは最大5x10個の細胞を含むことができる。一実施形態では、サンプルは、2×10~5.5×10個の細胞を含む。 Typically, the sample contains at least 2 × 10 5 cells. The sample can contain up to 5x10 5 cells. In one embodiment, the sample comprises 2 × 10 5 to 5.5 × 10 5 cells.

染色体座に存在するエピジェネティック染色体相互作用の架橋が本明細書に記載される。これは、細胞溶解が起こる前に行うことができる。細胞溶解は、3~7分間、例えば4~6分または約5分間行うことができる。いくつかの実施形態では、細胞溶解は、少なくとも5分間および10分間未満行われる。 Cross-linking of epigenetic chromosomal interactions present at chromosomal loci is described herein. This can be done before cytolysis occurs. Cytolysis can be performed for 3-7 minutes, eg 4-6 minutes or about 5 minutes. In some embodiments, cytolysis takes place for at least 5 minutes and less than 10 minutes.

制限酵素によるDNA消化が、本明細書に記載される。典型的には、DNA制限は約55℃~約70℃、例えば約65℃において約10~30分間、例えば約20分間行われる。 DNA digestion with restriction enzymes is described herein. Typically, DNA restriction is performed at about 55 ° C. to about 70 ° C., such as about 65 ° C. for about 10-30 minutes, such as about 20 minutes.

好ましくは、4000塩基対までの平均断片サイズを有する連結DNAの断片を生じるフリークエントカッター制限酵素が使用される。任意に、制限酵素は、約200~300塩基対、例えば約256塩基対の平均断片サイズを有する連結DNA断片をもたらす。一実施形態では、典型的な断片サイズは、200~4000塩基対、例えば400~2,000または500~1,000塩基対である。 Preferably, a frequent cutter restriction enzyme is used that produces a fragment of linked DNA with an average fragment size of up to 4000 base pairs. Optionally, the restriction enzyme results in a linked DNA fragment having an average fragment size of about 200-300 base pairs, eg, about 256 base pairs. In one embodiment, a typical fragment size is 200-4000 base pairs, eg 400-2,000 or 500-1,000 base pairs.

EpiSwitch法の一実施形態では、DNA沈殿工程は、DNA制限消化工程とDNA連結工程との間では行われない。 In one embodiment of the EpiSwitch method, the DNA precipitation step is not performed between the DNA restriction digestion step and the DNA ligation step.

DNAの連結が本明細書に記載される。典型的には、DNAの連結は5~30分間、例えば約10分間行われる。 DNA linkages are described herein. Typically, DNA ligation takes place for 5-30 minutes, eg about 10 minutes.

サンプル中のタンパク質は酵素的に、例えばプロテイナーゼ、任意にプロテイナーゼKを用いて消化することができる。タンパク質は約30分~1時間、例えば約45分間酵素消化することができる。一実施形態では、タンパク質の消化、例えばプロテイナーゼK消化後に架橋逆転またはDNAフェノール抽出工程は存在しない。 The protein in the sample can be digested enzymatically, for example with proteinase, optionally with proteinase K. The protein can be enzymatically digested for about 30 minutes to 1 hour, for example about 45 minutes. In one embodiment, there is no cross-linking reversal or DNA phenol extraction step after protein digestion, eg proteinase K digestion.

一実施形態では、PCR検出は、好ましくは連結核酸の有/無についてのバイナリ読出しにより、連結核酸の単一コピーを検出することができる。 In one embodiment, PCR detection can detect a single copy of the linked nucleic acid, preferably by binary reading of the presence / absence of the linked nucleic acid.

本発明のプロセスおよび使用
本発明のプロセスは、さまざまなやり方で記載することができる。本発明の方法は、連結核酸を作製する方法であって、(i)染色体相互作用において一体となる染色体領域をインビトロで架橋する工程、(ii)前記架橋DNAに切断または制限消化切断を施す工程、および(iii)前記架橋、切断されたDNA末端を連結して、連結核酸を形成する工程を含み、連結核酸の検出が遺伝子座における染色体の状態の判定に使用することができ、好ましくは、
-前記遺伝子座が、表9に記載の遺伝子座、領域または遺伝子のいずれかであり得、
-および/または前記染色体相互作用が、本明細書中に記載の、または表9に開示のプローブのいずれかに対応する染色体相互作用のいずれかであり得、および/または
-前記連結産物が、(i)表9に開示のプローブ配列のいずれかと同一であるか、または相同である配列;または(ii)(ii)に相補的な配列を有するか、または含む方法として記載することができる。
Processes and Uses of the Invention The processes of the invention can be described in a variety of ways. The method of the present invention is a method for producing a ligated nucleic acid, in which (i) a step of cross-linking a chromosomal region integrated in a chromosomal interaction in vitro, and (ii) a step of cleaving or limiting digestion cleaving of the cross-linked DNA. , And (iii) comprising ligating the crosslinked and cleaved DNA ends to form a ligated nucleic acid, the detection of the ligated nucleic acid can be used to determine the state of the chromosome at the locus, preferably.
-The locus can be any of the loci, regions or genes listed in Table 9.
-And / or said chromosomal interaction can be any of the chromosomal interactions described herein or corresponding to any of the probes disclosed in Table 9 and / or-the linked product. (I) A sequence that is identical or homologous to any of the disclosed probe sequences; or can be described as a method having or comprising a sequence complementary to (ii) (ii).

本発明のプロセスは、集団内の異なるサブグループを表す染色体状態を検出するプロセスであって、ゲノムの規定されたエピジェネティックに活性な(疾患関連)領域内における染色体相互作用の有無を判定する工程を含み、好ましくは
-前記サブグループが、乳がんの有無によって規定され、および/または
-前記染色体状態が、表9に記載の任意の遺伝子座、領域または遺伝子におけるものであり得、および/または
-前記染色体相互作用が、表9に記載のもの、またはその表に開示のプローブのいずれかに対応するもののいずれかであり得る方法として記載することができる。
The process of the present invention is the process of detecting chromosomal states representing different subgroups within a population, the step of determining the presence or absence of chromosomal interactions within a defined, epigenetically active (disease-related) region of the genome. And / or-the chromosomal state can be at any locus, region or gene set forth in Table 9, preferably-the subgroup is defined by the presence or absence of breast cancer, and / or-. The chromosomal interaction can be described as either one described in Table 9 or one corresponding to any of the probes disclosed in that table.

本発明は、表9に記載の任意の遺伝子座、遺伝子または領域における染色体相互作用を検出する工程を含む。本発明は、染色体相互作用を検出するための本明細書に記載の核酸およびプローブの使用、例えば、少なくとも1、2、4、6または8種の異なる遺伝子座または遺伝子における染色体相互作用を検出するための少なくとも1、2、4、6または8種のそのような核酸またはプローブの使用を含む。本発明は、表10に列挙されたプライマーもしくはプライマー対のいずれかを用いるか、または本明細書に記載のこれらのプライマーの変異体(プライマー配列を含むか、またはこれらのプライマー配列の断片および/またはホモログを含む配列)を用いる染色体相互作用の検出を含む。 The present invention comprises the step of detecting chromosomal interactions at any of the loci, genes or regions listed in Table 9. The present invention uses the nucleic acids and probes described herein to detect chromosomal interactions, eg, detect chromosomal interactions at at least 1, 2, 4, 6 or 8 different loci or genes. Includes the use of at least 1, 2, 4, 6 or 8 such nucleic acids or probes for. The invention uses either the primers or primer pairs listed in Table 10 or variants of these primers described herein (including primer sequences or fragments of these primer sequences and / Or the detection of chromosomal interactions using sequences containing homologs).

特定の実施形態では、
-遺伝子座は、例えば、マーカーセット2または3についての任意の表に記載の遺伝子座、領域または遺伝子のいずれかであり得、
-および/または染色体相互作用は、本明細書に記載の染色体相互作用、または例えばマーカーセット2または3についての任意の表に開示のプローブのいずれかに対応するものであり得、および/または
-連結産物は、(i)例えばマーカーセット2または3についての任意の表に開示のプローブ配列のいずれかと同一もしくは相同である配列、;または(ii)(ii)に相補的な配列、を有するか、または含み得る。
In certain embodiments,
-The locus can be, for example, any of the loci, regions or genes listed in any table for marker set 2 or 3.
-And / or chromosomal interactions can correspond to any of the chromosomal interactions described herein, or, for example, the probes disclosed in any table for marker sets 2 or 3 and / or-. Does the ligation product have (i) a sequence that is identical or homologous to any of the probe sequences disclosed in any table, eg, for marker sets 2 or 3; or a sequence that is complementary to (ii) (ii)? , Or may include.

本発明のプロセスは、集団内の異なるサブグループを表す染色体状態を検出するプロセスであって、ゲノムの規定されたエピジェネティックに活性な(疾患関連)領域内における染色体相互作用の有無を判定する工程を含み、好ましくは
-前記サブグループが、乳がんの有無によって規定され、および/または
-前記染色体状態が、例えばマーカーセット2または3についての任意の表に記載の任意の遺伝子座、領域または遺伝子におけるものであり得、および/または
-前記染色体相互作用が、例えばマーカーセット2または3についての任意の表に記載のもの、またはその表に開示のプローブのいずれかに対応するもののいずれかであり得る方法として記載することができる。
The process of the present invention is the process of detecting chromosomal states representing different subgroups within a population, the step of determining the presence or absence of chromosomal interactions within a defined, epigenetically active (disease-related) region of the genome. And preferably-the subgroup is defined by the presence or absence of breast cancer and / or-the chromosomal state is at any locus, region or gene described in any table, eg, for marker set 2 or 3. And / or-the chromosomal interaction can be either one described in any table for, for example, marker set 2 or 3, or one corresponding to any of the probes disclosed in that table. It can be described as a method.

本発明は、例えばマーカーセット2または3についての任意の表に記載の任意の遺伝子座、遺伝子または領域における染色体相互作用を検出する工程を含む。本発明は、染色体相互作用を検出するための本明細書に記載の核酸およびプローブの使用、例えば、少なくとも1、2、4、6または8種の異なる遺伝子座または遺伝子における染色体相互作用を検出するための少なくとも1、2、4、6または8種のそのような核酸またはプローブの使用を含む。本発明は、例えばマーカーセット2もしくは3についての任意の表に列挙されたプライマーもしくはプライマー対のいずれかを用いるか、または本明細書に記載のこれらのプライマーの変異体(プライマー配列を含むか、またはこれらのプライマー配列の断片および/またはホモログを含む配列)を用いる、染色体相互作用の検出を含む。 The present invention comprises the step of detecting chromosomal interactions at any locus, gene or region described in any table, eg, for marker set 2 or 3. The present invention uses the nucleic acids and probes described herein to detect chromosomal interactions, eg, detect chromosomal interactions at at least 1, 2, 4, 6 or 8 different loci or genes. Includes the use of at least 1, 2, 4, 6 or 8 such nucleic acids or probes for. The present invention uses, for example, either the primers or primer pairs listed in any table for marker sets 2 or 3, or variants of these primers described herein, including or containing primer sequences. Includes detection of chromosomal interactions using (or sequences containing fragments and / or homologs of these primer sequences).

新しい治療を同定するための本発明の方法の使用
染色体相互作用に関する知識は、状態の新しい治療法を同定するために使用することができる。本発明は、乳がんのための新しい治療剤を同定または設計するために、本明細書で定義される染色体相互作用の方法および使用を提供する。
Use of the Methods of the Invention to Identify New Therapies Knowledge of chromosomal interactions can be used to identify new therapies for the condition. The present invention provides methods and uses of chromosomal interactions as defined herein for identifying or designing new therapeutic agents for breast cancer.

ホモログ
ポリヌクレオチド/核酸(例えば、DNA)配列のホモログを、本明細書において言及する。そのようなホモログは、典型的には、少なくとも70%の相同性、好ましくは少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも97%、少なくとも98%または少なくとも99%の相同性を、例えば、少なくとも10、15、20、30、100またはそれ以上の連続したヌクレオチドの領域にわたって、または染色体相互作用に関与する染色体領域に由来する核酸部分にわたって有する。相同性は、ヌクレオチド同一性(時に「ハードホモロジー(hard homology)」と称される)に基づいて計算することができる。
Homolog A homolog of a polynucleotide / nucleic acid (eg, DNA) sequence is referred to herein. Such homologs typically have at least 70% homology, preferably at least 80%, at least 85%, at least 90%, at least 95%, at least 97%, at least 98% or at least 99% homology. For example, across regions of at least 10, 15, 20, 30, 100 or more contiguous nucleotides, or across nucleic acid moieties derived from chromosomal regions involved in chromosomal interactions. Homology can be calculated on the basis of nucleotide identity (sometimes referred to as "hard homology").

したがって、特定の実施形態では、ポリヌクレオチド/核酸(例えば、DNA)配列のホモログは、配列同一性のパーセンテージを参照して本明細書で言及される。典型的にはそのようなホモログは、少なくとも70%の配列同一性、好ましくは少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも97%、少なくとも98%または少なくとも99%の配列同一性を、例えば、少なくとも10、15、20、30、100またはそれ以上の連続したヌクレオチドの領域にわたって、または染色体相互作用に関与する染色体領域に由来する核酸部分にわたって有する。 Thus, in certain embodiments, homologues of polynucleotide / nucleic acid (eg, DNA) sequences are referred to herein with reference to the percentage of sequence identity. Typically, such homologs have at least 70% sequence identity, preferably at least 80%, at least 85%, at least 90%, at least 95%, at least 97%, at least 98% or at least 99% sequence identity. It has sex, for example, across regions of at least 10, 15, 20, 30, 100 or more contiguous nucleotides, or across nucleic acid moieties derived from chromosomal regions involved in chromosomal interactions.

例えば、UWGCGパッケージは、(例えばそのデフォルト設定で使用される)相同性および/または%配列同一性を計算するために使用できるBESTFITプログラムを提供する(Devereuxら(1984)Nucleic Acids Research 12、p387-395)。例えばAltschul S.F.(1993)J MoI Evol 36:290-300;Altschul,S,F et al(1990)J MoI Biol 215:403-10に記載されているように、PILEUPおよびBLASTアルゴリズムを用いて、相同性および/または配列同一性%を計算することができ、および/または、配列を整列させることができる((通常はそれらのデフォルト設定で)等価または対応する配列の同定)。 For example, the UWGCG package provides a BESTFIT program that can be used to calculate homology and / or% sequence identity (eg, used in its default settings) (Deverex et al. (1984) Nucleic Acids Research 12, p387- 395). For example, Altschul S. et al. F. (1993) J MoI Evol 36: 290-300; Altschul, S, F et al (1990) J MoI Biol 215: 403-10, using the PILEUP and BLAST algorithms, homology and /. Or the% sequence identity can be calculated and / or the sequences can be aligned (usually with their default settings) to identify equivalent or corresponding sequences).

BLAST分析を実行するためのソフトウェアは、National Center for Biotechnology Informationを通じて公的に入手可能である。このアルゴリズムは、データベース配列中の同じ長さの文字列とアライメントしたときに、いくつかの正の値の閾値スコアTと一致するか、またはこれを満たすクエリ配列中の長さWの短い文字列を特定することによって、高いスコア配列対(HSP)を最初に特定する工程を含む。Tは近傍文字列スコア閾値と呼ばれる(Altschulら、上記)。これらの最初の近傍文字列ヒットは、それらを含むHSPを見つけるための検索を開始するための種として機能する。文字列ヒットは、累積アライメントスコアを増加させることができる限り、各配列に沿って両方向に伸長される。各方向の文字列ヒットの伸長は、累積アライメントスコアが最大達成値から量Xだけ下落した時、1つまたは複数のネガティブスコアリング残基アラインメントの蓄積のために、累積スコアがゼロ以下になる時、またはいずれかの配列の末端に到達した時に停止される。BLASTアルゴリズムパラメータW5 TおよびXは、アライメントの感度および速度を決定する。BLASTプログラムは、デフォルトとして、ワード長(W)が11、BLOSUM62スコアリング行列(HenikoffおよびHenikoff(1992)Proc.Natl.Acad.Sci.USA 89:10915-10919参照)アライメント(B)が50、期待値(E)が10、M=5、N=4、および両方の鎖の比較をデフォルトとして使用する。 Software for performing BLAST analysis is publicly available through the National Center for Biotechnology Information. This algorithm is a short string of length W in a query array that matches or satisfies some positive threshold score T when aligned with a string of the same length in the database array. Includes the step of first identifying a high score sequence pair (HSP) by identifying. T is called the neighborhood string score threshold (Altschul et al., Supra). These first neighborhood string hits serve as a seed to initiate a search to find HSPs containing them. String hits are stretched in both directions along each sequence as long as the cumulative alignment score can be increased. The extension of string hits in each direction is when the cumulative alignment score drops by an amount X from the maximum achieved value, or when the cumulative score drops below zero due to the accumulation of one or more negative scoring residue alignments. , Or when it reaches the end of any of the sequences, it is stopped. The BLAST algorithm parameters W5 T and X determine the sensitivity and speed of alignment. The BLAST program defaults to 11 word lengths (W), 50 BLASTUM62 scoring matrices (see Henikoff and Henikoff (1992) Proc. Natl. Acad. Sci. USA 89: 10915-10919), and expectation (B). The value (E) is 10, M = 5, N = 4, and comparison of both chains is used as the default.

BLASTアルゴリズムは、2つの配列間の類似性の統計分析を行い、例えば、Karlin and Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5787を参照されたい。BLASTアルゴリズムによって提供される類似性の1つの尺度は、2つのポリヌクレオチド配列間の一致が偶然に起こる確率の指標を提供する最小和確率(P(N))である。例えば、第1の配列と第2の配列との比較における最小和確率が約1未満、好ましくは約0.1未満、より好ましくは約0.01未満、最も好ましくは約0.001未満である場合、配列はもう一方の配列と類似していると考えられる。 The BLAST algorithm performs a statistical analysis of the similarity between the two sequences, eg, Karlin and Altschul (1993) Proc. Natl. Acad. Sci. See USA 90: 5873-5787. One measure of similarity provided by the BLAST algorithm is the minimum sum probability (P (N)), which provides an indicator of the probability that a match between two polynucleotide sequences will occur by chance. For example, the minimum sum probability in comparing the first sequence to the second sequence is less than about 1, preferably less than about 0.1, more preferably less than about 0.01, most preferably less than about 0.001. If so, the sequence is considered to be similar to the other sequence.

相同配列は、典型的には1、2、3、4またはそれ以上の塩基、例えば10、15または20塩基未満(ヌクレオチドの置換、欠失または挿入であり得る)で異なる。これらの変化は、相同性および/または配列同一性%の計算に関して上記の領域のいずれかにわたって測定することができる。 Homological sequences typically differ for 1, 2, 3, 4 or more bases, such as less than 10, 15 or 20 bases (which can be nucleotide substitutions, deletions or insertions). These changes can be measured over any of the above regions with respect to the calculation of homology and / or% sequence identity.

アレイ
第2の核酸セットはアレイに結合されていてもよく、一実施形態では、アレイに結合された少なくとも15,000、45,000、100,000または250,000個の異なる第2の核酸があり、これらは好ましくは少なくとも300、900、2000または5000の遺伝子座において表される。一実施形態では、第2の核酸の異なる集団のうちの1または複数、またはすべてが、アレイの2以上の異なる領域に結合され、アレイ上で実質的に繰り返され、エラー検出を可能にする。アレイは、Agilent SurePrint G3 Custom CGHマイクロアレイプラットフォームに基づいていてよい。アレイへの第1の核酸の結合の検出は、二色システムによって行うことができる。
The second set of nucleic acids in the array may be bound to the array, and in one embodiment, at least 15,000, 45,000, 100,000 or 250,000 different second nucleic acids bound to the array. Yes, these are preferably represented at at least 300, 900, 2000 or 5000 loci. In one embodiment, one or more or all of the different populations of the second nucleic acid are bound to two or more different regions of the array and are substantially repeated on the array to allow error detection. The array may be based on the Agilent SurePrint G3 Custom CGH microarray platform. Detection of the binding of the first nucleic acid to the array can be performed by a bicolor system.

治療剤
治療剤が本明細書に記載される。本発明は、特定の個体、例えば本発明のプロセスによって同定された個体において、乳がんの予防または治療に使用するための薬剤を提供する。これは、治療有効量の薬剤を必要とする個体に投与する工程を含み得る。本発明は、特定の個体において乳がんを予防または治療するための薬剤の製造における前記薬剤の使用を提供する。
Therapeutic Agents Therapeutic agents are described herein. The present invention provides agents for use in the prevention or treatment of breast cancer in a particular individual, eg, an individual identified by the process of the invention. This may include administering to an individual in need of a therapeutically effective amount of the drug. The present invention provides the use of said agents in the manufacture of agents for the prevention or treatment of breast cancer in a particular individual.

好ましい治療剤は、がん細胞の増殖を妨害するために使用される細胞傷害性薬物である。乳がんを治療するために一般的に使用される多数の異なる化学療法薬がある。これらには、シクロホスファミド、エピルビシン、フルオロウラシル(5FU)、メトトレキサート、マイトマイシン、ミトザントロン、ドキソルビシン、ドセタキセル(タキソテール)およびゲムシタビン(ジェムザール)が含まれる。通常、患者には約3種類の化学療法薬が併用される。この治療剤は、がん細胞の増殖を引き起こすホルモンのレベルを低下させることができる。ホルモン療法に使用されるさまざまな薬物には、アナストロゾール(アリミデックス)、エキセメスタン(アロマシン)、レトロゾール(フェマーラ)およびタモキシフェンが含まれる。治療剤は、癌性細胞間の相互作用を妨害し、それによって細胞***および増殖を停止させる薬物などの生物学的療法であることができる。生物学的療法に一般的に使用される薬物には、ハーセプチン(トラスツズマブ)、ラパチニブ(タイバーブ)、ペルツズマブ(パージェタ)およびエベロリムス(アフィニトール)が含まれる。 Preferred therapeutic agents are cytotoxic drugs used to block the growth of cancer cells. There are many different chemotherapeutic agents commonly used to treat breast cancer. These include cyclophosphamide, epirubicin, fluorouracil (5FU), methotrexate, mitomycin, mitozantron, doxorubicin, docetaxel (taxotere) and gemcitabine (gemcitabine). Patients are usually given about three chemotherapeutic agents in combination. This therapeutic agent can reduce the levels of hormones that cause the growth of cancer cells. Various drugs used in hormone therapy include anastrozole (Arimidex), exemestane (Aromasin), letrozole (Femara) and tamoxifen. Therapeutic agents can be biological therapies, such as drugs, that interfere with the interactions between cancerous cells, thereby stopping cell division and proliferation. Commonly used drugs for biotherapy include Herceptin (trastuzumab), lapatinib (Tybarb), pertuzumab (Perjeta) and everolimus (Affinitol).

薬剤は、薬剤の性質に応じて製剤化される。薬剤は、該薬剤と医薬として許容される担体または希釈剤とを含有する医薬組成物の形態で提供される。適切な担体および希釈剤には、等張性生理食塩水、例えばリン酸緩衝化生理食塩水が含まれる。典型的な経口投薬組成物には、錠剤、カプセル、溶液および懸濁液が含まれる。薬剤は、非経口、静脈内、筋肉内、皮下、経皮または経口投与用に製剤化することができる。 The drug is formulated according to the nature of the drug. The agent is provided in the form of a pharmaceutical composition containing the agent and a pharmaceutically acceptable carrier or diluent. Suitable carriers and diluents include isotonic saline, such as phosphate buffered saline. Typical oral dosage compositions include tablets, capsules, solutions and suspensions. The drug can be formulated for parenteral, intravenous, intramuscular, subcutaneous, transdermal or oral administration.

薬剤の用量は、さまざまなパラメータ、特に使用される物質、治療されるべき個体の年齢、体重および状態、投与経路、および必要とされる投薬計画に応じて決定することができる。医師は、任意の特定の薬剤の必要な投与経路および投薬量を決定することができる。しかしながら、適切な用量は、例えば1日当たり1~3回服用されるように、0.1~100mg/kg体重、例えば1~40mg/kg体重であってもよい。 The dose of the drug can be determined according to various parameters, in particular the substance used, the age, weight and condition of the individual to be treated, the route of administration, and the dosing regimen required. The physician can determine the required route of administration and dosage of any particular drug. However, the appropriate dose may be 0.1-100 mg / kg body weight, for example 1-40 mg / kg body weight, for example taken 1 to 3 times per day.

本明細書に記載の物質の形態
本明細書に記載の核酸または治療剤などの物質のいずれかは、精製または単離された形態であり得る。それらは、自然界に見出されるものとは異なる形態であってもよく、例えば、他の物質との天然には生じない組み合わせで存在してもよい。核酸(本明細書で規定される配列の部分を含む)は、天然に見出される配列とは異なる、例えば、相同性に関する節に記載されるように配列中に少なくとも1、2、3、4つまたはそれ以上のヌクレオチド変化を有する配列を有してもよい。核酸は、5’または3’末端に異種配列を有することができる。核酸は、天然に見出されるものと化学的に異なるものであってもよく、例えば、何らかの方法で修飾されてもよいが、ワトソン-クリック塩基対形成が依然として可能であることが好ましい。適切な場合、核酸は、二本鎖または一本鎖形態で提供される。本発明は、本明細書において言及される特異的核酸配列のすべてを一本鎖または二本鎖形態で提供し、したがって、開示される任意の配列に対する相補鎖を含む。
Forms of Substances Described herein Any of the substances such as nucleic acids or therapeutic agents described herein can be in purified or isolated form. They may be in a different form than those found in nature, for example, in combinations that do not occur naturally with other substances. Nucleic acids, including parts of the sequences defined herein, differ from naturally found sequences, eg, at least 1, 2, 3, 4 in the sequence as described in the section on homology. Alternatively, it may have a sequence having a nucleotide change of more than that. Nucleic acids can have heterologous sequences at the 5'or 3'ends. Nucleic acids may be chemically different from those found in nature, for example, may be modified in some way, but it is preferred that Watson-Crick base pairing is still possible. Where appropriate, nucleic acids are provided in double-stranded or single-stranded form. The present invention provides all of the specific nucleic acid sequences referred to herein in single-stranded or double-stranded form, and thus includes complementary strands to any of the disclosed sequences.

本発明はまた、乳がんに関連する染色体相互作用の検出または乳がんの診断を含む、本発明の任意のプロセスを実施するためのキットを提供する。このようなキットは、本発明のプロセスによって生成された連結核酸を検出することができる薬剤のような、関連する染色体相互作用を検出することができる特異的結合剤を含むことができる。キット中に存在する好ましい薬剤には、例えばPCR反応において連結核酸を増幅することができる、本明細書に記載のように連結核酸またはプライマー対にハイブリダイズすることができるプローブが含まれる。 The invention also provides a kit for carrying out any process of the invention, including detection of chromosomal interactions associated with breast cancer or diagnosis of breast cancer. Such kits can include specific binders capable of detecting related chromosomal interactions, such as agents capable of detecting linked nucleic acids produced by the process of the invention. Preferred agents present in the kit include, for example, a probe capable of amplifying the linked nucleic acid in a PCR reaction and capable of hybridizing to the linked nucleic acid or primer pair as described herein.

本発明はまた、関連する染色体相互作用を検出することができるデバイスを提供する。このデバイスは、好ましくは、本明細書に記載の任意のこのような薬剤、プローブまたはプライマー対のような、染色体相互作用を検出することができる任意の特異的結合剤、プローブまたはプライマー対を含む。 The invention also provides a device capable of detecting related chromosomal interactions. The device preferably comprises any specific binder, probe or primer pair capable of detecting chromosomal interactions, such as any such agent, probe or primer pair described herein. ..

検出方法
一実施形態では、染色体相互作用に関連する連結配列の定量的検出は、PCR反応中に活性化すると検出可能なプローブを用いて行われ、前記連結配列は、エピジェネティック染色体相互作用において一体となる2つの染色体領域からの配列を含み、前記方法は、PCR反応の間に前記連結配列を前記プローブと接触させ、前記プローブの活性化の程度を検出する工程を含み、前記プローブは前記連結部位に結合する。この方法は、典型的には、二重標識蛍光加水分解プローブを使用して、MIQEに準拠した様式で特定の相互作用の検出を可能にする。
Detection Method In one embodiment, quantitative detection of ligated sequences associated with chromosomal interactions is performed using a probe that can be detected when activated during a PCR reaction, the ligated sequences being integrated in epigenetic chromosomal interactions. Containing sequences from two chromosomal regions that are It binds to the site. This method typically uses a double-labeled fluorescent hydrolysis probe to allow detection of specific interactions in a MQE-compliant manner.

プローブは、一般に、不活性な状態と活性な状態とを有する検出可能な標識で標識され、活性化された場合にのみ検出される。活性化の程度は、PCR反応において存在する鋳型(連結産物)の程度に関連する。検出は、PCRの全体または一部の間、例えば、PCRサイクルの少なくとも50%または80%の間に行うことができる。 Probes are generally labeled with a detectable label having an inactive state and an active state and are only detected when activated. The degree of activation is related to the degree of template (linkage) present in the PCR reaction. Detection can be performed during whole or part of the PCR, eg, at least 50% or 80% of the PCR cycle.

プローブは、オリゴヌクレオチドの一端に共有結合したフルオロフォアと、ヌクレオチドの他端に結合したクエンチャーとを含むことができ、フルオロフォアの蛍光がクエンチャーによって消光される。一実施形態では、フルオロフォアはオリゴヌクレオチドの5’末端に結合し、クエンチャーはオリゴヌクレオチドの3’末端に共有結合している。本発明の方法に使用できるフルオロフォアには、FAM、TET、JOE、ヤキマイエロー、HEX、シアニン3、ATTO 550、TAMRA、ROX、テキサスレッド、シアニン3.5、LC610、LC640、ATTO647N、シアニン5、シアニン5.5およびATTO680が含まれる。適切なフルオロフォアと共に使用することができるクエンチャーには、TAM、BHQ1、DAB、Eclip、BHQ2およびBBQ650が含まれ、任意に前記フルオロフォアはHEX、テキサスレッドおよびFAMから選択される。フルオロフォアとクエンチャーの好ましい組み合わせには、FAMとBHQ1、およびテキサスレッドとBHQ2が含まれる。 The probe can include a fluorophore covalently attached to one end of the oligonucleotide and a quencher attached to the other end of the nucleotide, and the fluorescence of the fluorophore is quenched by the quencher. In one embodiment, the fluorophore is attached to the 5'end of the oligonucleotide and the quencher is covalently attached to the 3'end of the oligonucleotide. Fluorophores that can be used in the method of the present invention include FAM, TET, JOE, Yakima Yellow, HEX, Cyanine 3, ATTO 550, TAMRA, ROX, Texas Red, Cyanine 3.5, LC610, LC640, ATTO647N, Cyanine 5, Includes cyanine 5.5 and ATTO680. Quenches that can be used with suitable fluorophores include TAM, BHQ1, DAB, Hex, BHQ2 and BBQ650, optionally said fluorophores are selected from HEX, Texas Red and FAM. Preferred combinations of fluorophores and quenchers include FAM and BHQ1 and Texas Red and BHQ2.

qPCRアッセイにおけるプローブの使用
本発明の加水分解プローブは、典型的には濃度が一致する陰性対照により温度勾配最適化される。好ましくは、単一工程PCR反応が最適化される。より好ましくは、標準曲線が計算される。連結配列の接合部をまたいで結合する特異的プローブを用いる利点は、連結配列に対する特異性が、ネステッドPCRアプローチを使用することなく達成され得ることである。本明細書に記載の方法は、低コピー数標的の正確かつ的確な定量化を可能にする。標的連結配列は、温度勾配最適化の前に精製、例えばゲル精製することができる。標的連結配列を配列決定することができる。好ましくは、PCR反応は、約10ng、または5~15ng、または10~20ng、または10~50ng、または10~200ngの鋳型DNAを用いて行われる。フォワードプライマーおよびリバースプライマーは、一方のプライマーが連結DNA配列中に表される染色体領域の1つの配列に結合し、他方のプライマーが連結DNA配列中に表される他の染色体領域に、例えば、前記配列に相補的であることによって結合するように設計される。
Use of Probes in qPCR Assays The hydrolyzed probes of the invention are typically temperature gradient optimized with a matching negative control. Preferably, a single step PCR reaction is optimized. More preferably, a standard curve is calculated. The advantage of using a specific probe that binds across the junction of the ligated sequence is that specificity for the ligated sequence can be achieved without using the nested PCR approach. The methods described herein allow accurate and accurate quantification of low copy count targets. The target linkage sequence can be purified, eg, gel purified, prior to temperature gradient optimization. Target linkage sequences can be sequenced. Preferably, the PCR reaction is carried out with about 10 ng, or 5-15 ng, or 10-20 ng, or 10-50 ng, or 10-200 ng of template DNA. Forward and reverse primers are such that one primer binds to one sequence of the chromosomal region represented in the linked DNA sequence and the other primer binds to the other chromosomal region represented in the linked DNA sequence, eg, said. Designed to bind by being complementary to the sequence.

連結DNA標的の選択
本発明は、本明細書で定義されるPCR法で使用するためのプライマーおよびプローブを選択する工程であって、連結配列に結合して増幅するそれらの能力に基づいてプライマーを選択すること、および結合する標的配列の特性、特に、標的配列の湾曲に基づきプローブ配列を選択することを含む工程を含む。
Selection of Linked DNA Targets The present invention is a step of selecting primers and probes for use in the PCR method defined herein, based on their ability to bind and amplify linked sequences. The process comprises selecting and selecting the probe sequence based on the characteristics of the target sequence to be bound, in particular the curvature of the target sequence.

プローブは、典型的には、制限部位にまたがる並置された制限断片である連結配列に結合するように設計/選択される。本発明の一実施形態では、特定の染色体相互作用に関連する連結配列候補の予測湾曲が、例えば本明細書で参照される特定のアルゴリズムを用いて計算される。湾曲は、ヘリカルターン当たりの角度、例えば10.5°/ヘリカルターンとして表すことができる。連結配列は、連結配列が少なくとも5°/ヘリカルターン、典型的には少なくとも10°、15°または20°/ヘリカルターン、例えば5°~20°/ヘリカルターンの湾曲傾向ピークスコアを有する場合に標的とするように選択される。好ましくは、ヘリカルターン当たりの湾曲傾向スコアは、連結部位の上流および/または下流の20~400塩基など、少なくとも20、50、100、200または400塩基について計算される。したがって、一実施形態では、連結産物中の標的配列は、これらのレベルの湾曲のいずれかを有する。標的配列は、最低の熱力学的構造自由エネルギーに基づいて選択することもできる。 The probe is typically designed / selected to bind to a ligation sequence that is a juxtaposed restriction fragment that spans the restriction sites. In one embodiment of the invention, the predicted curvature of linked sequence candidates associated with a particular chromosomal interaction is calculated using, for example, the particular algorithm referred to herein. The curvature can be expressed as an angle per helical turn, eg 10.5 ° / helical turn. Linked sequences are targeted if the linked sequence has a curvature propensity peak score of at least 5 ° / helical turn, typically at least 10 °, 15 ° or 20 ° / helical turn, eg 5 ° to 20 ° / helical turn. Is selected to be. Preferably, the curvature propensity score per helical turn is calculated for at least 20, 50, 100, 200 or 400 bases, such as 20-400 bases upstream and / or downstream of the link site. Thus, in one embodiment, the target sequence in the linkage product has one of these levels of curvature. Target sequences can also be selected based on the lowest thermodynamic structural free energy.

特定の実施形態
特定の実施形態では、IGFBP3における染色体相互作用は、型付け/検出されない。
Specific Embodiments In certain embodiments, chromosomal interactions in IGFBP3 are not typed / detected.

特定の実施形態では、本明細書に記載の遺伝子のいずれかにおける染色体相互作用は、型付け/検出されない:一実施形態では、以下の遺伝子のいずれかは型付け/検出されない:
BCAS1、ZNF217、TSHZ2、SUMO1P1、MIR4756、BCAS3、TBX2、C17orf82、TBX4、BCA54、LINC00651、UBE2V1、TMEM189、CEBPB、LOC284751、PTPNI、MIR645、FAM65C PARD68、ADNP、LINC00494、PREX1、ARFGEF2、CSE1L、PDE4DIP、SEC22B、NOTCH2NL NBP10、HFE2,TXNIP、POLR3GL、ANKRD34A、LIX1L、RBM8A、GNRHR2、PEX11B、ITGA10、ANKRD35、PIAS3、NUDTI7、POLR3C、RNF115、CD160、PDZK1、GPR89A、ZNF334。OCSTAMP、SLC13A3、TP53RK、SLC2A10、EYA2、MIR3616、ZMYND8、L0C100131496、DLG1、MIR4797、DLG1-AS1、BDH1、LOC22072;9、KIAA0226、MIR922、FYTTDl、LRCH3、IQCG、RPL35A、LMLN、ANKRD18DP、DDX59、CAMSAP2、GPR25、C1orf106、KIF21B、CACNA15、ASCLS、TMEM9、IGFN1、PKP1、TNN2、LAD1、TNNI1、PHLDA3、NCOA1、PTRHD1、CENPO、ADCY3、DNAJC27、DNAJC27-AS1、EFR3B。POMC、DNMT3A、MIR1301、DTNB、SPON2、LOC100130872、CTBP1、CTBP1-AS1、MAEA、UVSSA、CRIPAK、FAM53A、SLBP、TMEM129、TACC3、FGFR3、LETM1、WHSC1、SCARNA22、WHSC2、MIR943、C4orf48、NAT8L、POLN、HAUS3、MXD4、MIR4800、ZFYVE28、LOC402160、RNF4、LOC1OO506190、C9orf50、NTMT1、ASB6、PRRX2、PTGES、TOR1B、TOR1A、C9orf78、USP20、FNBP1、GPR107、NC51、ASS1。
In certain embodiments, chromosomal interactions in any of the genes described herein are not typed / detected: in one embodiment, any of the following genes is not typed / detected:
BCAS1, ZNF217, TSHZ2, SUMO1P1, MIR4756, BCAS3, TBX2, C17orf82, TBX4, BCA54, LINK00651, UBE2V1, TMEM189, CEBPB, LOC284751, PTPNI, MIR645, FAM65 , NOTCH2NL NBP10, HFE2, TXNIP, POLR3GL, ANKRD34A, LIX1L, RBM8A, GNRHR2, PEX11B, ITGA10, ANKRD35, PIAS3, NUDTI7, POLR3C, RNF115, CD160. OCSTAMP, SLC13A3, TP53RK, SLC2A10, EYA2, MIR3616, ZMYND8, L0C100131496, DLG1, MIR4797, DLG1-AS1, BDH1, LOC22072; GPR25, C1orf106, KIF21B, CACNA15, ASCLS, TMEM9, IGFN1, PKP1, TNN2, LAD1, TNNI1, PHLDA3, NCOA1, PTRHD1, CENPO, ADCY3, DNAJC27, DNAJC27-AS1, EFRB3. POMC, DNMT3A, MIR1301, DTNB, SPON2, LOC100130872, CTBP1, CTBP1-AS1, MAEA, UVSSA, CRIPAK, FAM53A, SLBP, TMEM129, TACC3, FGFR3, LETM1, WHSC1, SCARNA22, WHSC1 HAUS3, MXD4, MIR4800, ZFYVE28, LOC402160, RNF4, LOC1OO506190, C9orf50, NTMT1, ASB6, PRRX2, PTGES, TOR1B, TOR1A, C9orf78, USP20, FNBP1, GPR107, N.

一実施形態では、染色体内相互作用のみが型付け/検出され、(異なる染色体間の)染色体外相互作用は型付け/検出されない。 In one embodiment, only intrachromosomal interactions are typed / detected, and extrachromosomal interactions (between different chromosomes) are not typed / detected.

刊行物
本明細書に記載のすべての刊行物の内容は、参照により本明細書中に組み込まれ、本発明に関連する特徴をさらに規定するために使用することができる。
Publications The contents of all publications described herein are incorporated herein by reference and can be used to further define the features associated with the invention.

特定の実施形態
EpiSwitch(商標)プラットフォーム技術は、遺伝子座における正常状態と異常状態との間の調節変化のエピジェネティックな調節シグネチャーを検出する。EpiSwitch(商標)プラットフォームは、染色体コンフォメーションシグネチャーとしても知られているヒト染色体の調節的高次構造に関連する遺伝子調節の基本的なエピジェネティックレベルを同定およびモニターする。染色体シグネチャーは、遺伝子調節解除のカスケードにおける明確な主要工程である。それらは、DNAメチル化およびRNAプロファイリングのような後期エピジェネティックバイオマーカー、および遺伝子発現バイオマーカーを利用するバイオマーカープラットフォームに対して、独特の利点のセットを有する高次バイオマーカーである。
Specific Embodiment EpiSwitch ™ platform technology detects epigenetic regulatory signatures of regulatory changes between normal and abnormal states at loci. The EpiSwitch ™ platform identifies and monitors the basic epigenetic levels of gene regulation associated with the regulatory higher-order structure of human chromosomes, also known as chromosomal conformational signatures. Chromosome signatures are a clear major step in the deregulation cascade. They are higher-order biomarkers with a unique set of advantages for late epigenetic biomarkers such as DNA methylation and RNA profiling, and biomarker platforms that utilize gene expression biomarkers.

EpiSwitch(商標)アレイアッセイ
カスタムEpiSwitch(商標)アレイスクリーニングプラットフォームは、15K、45K、100K、および250Kの4種の密度で独自の染色体コンフォメーションを持ち、各キメラ断片がアレイ上で4回反復され、有効密度はそれぞれ60K、180K、400K、および100万になる。
EpiSwitch® Array Assay The custom EpiSwitch® array screening platform has unique chromosomal conformations at four densities of 15K, 45K, 100K, and 250K, with each chimeric fragment being repeated four times on the array. Effective densities are 60K, 180K, 400K, and 1 million, respectively.

カスタム設計のEpiSwitch(商標)アレイ
15KのEpiSwitch(商標)アレイは、EpiSwitch(商標)バイオマーカーディスカバリー技術を使用して調べた約300の遺伝子座を含む全ゲノムをスクリーニングすることができる。EpiSwitch(商標)アレイは、Agilent SurePrint G3 Custom CGH マイクロアレイプラットフォーム上に構築されており、この技術は、4種の密度、60K、180K、400K、および100万のプローブを提供する。各EpiSwitch(商標)プローブは4連で表示されるため、アレイ当たりの密度は15K、45K、100K、250Kに減少し、再現性の統計的評価が可能になる。遺伝子座当たりの調べるEpiSwitch(商標)マーカー候補の平均数は50であり、調査できる遺伝子座の数は300、900、2000、および5000である。
Custom-designed EpiSwitch® Array The 15K EpiSwitch® Array can screen the entire genome containing approximately 300 loci examined using EpiSwitch® biomarker discovery technology. The EpiSwitch ™ array is built on an Agilent SurePrint G3 Custom CGH microarray platform, and the technology provides four densities, 60K, 180K, 400K, and 1 million probes. Since each EpiSwitch ™ probe is displayed in quadruples, the density per array is reduced to 15K, 45K, 100K, 250K, allowing statistical evaluation of reproducibility. The average number of EpiSwitch ™ marker candidates examined per locus is 50, and the number of loci that can be investigated is 300, 900, 2000, and 5000.

EpiSwitch(商標)カスタムアレイパイプライン
EpiSwitch(商標)アレイは、EpiSwitch(商標)ライブラリー生成後にCy5で標識されたサンプルの1つのセットと、Cy3で標識された比較/分析されるサンプル(対照)のもう1つのセットとの2色システムである。アレイは、Agilent SureScanスキャナーを使用してスキャンされ、得られた特徴はAgilent Feature Extractionソフトウェアを使用して抽出される。その後、データはRでEpiSwitch(商標)アレイ処理スクリプトを使用して処理される。このアレイは、RでのBioconductor:Limma*の標準2色パッケージを使用して処理される。アレイの正規化は、Limma*のアレイ内正規化機能を使用して行い、これは、オンチップのAgilent陽性対照およびEpiSwitch(商標)陽性対照に対して行われる。データはAgilent Flagコールに基づいてフィルタリングされ、Agilent対照プローブは削除され、技術的複製プローブはLimma*を使用して解析するために平均化される。プローブは、比較される2つのシナリオの間の差異に基づいてモデル化され、偽発見率を使用して補正される。さらなるスクリーニングのために、変動係数(CV)≦30%で、≦-1.1または≧1.1であり、p≦0.1FDRのp値を有するプローブが使用される。プローブセットを減らすために、RでFactorMineRパッケージを使用して、多因子分析がさらに実行される。
*注:LIMMAは、マイクロアレイ実験における差次的発現を評価するための線形モデルおよび経験ベイズ法である。Limmaは、マイクロアレイまたはRNA-Seqから生じる遺伝子発現データの解析用のRパッケージである。
EpiSwitch® Custom Array Pipeline The EpiSwitch® array is a set of Cy5 labeled samples and Cy3 labeled sample (control) after the generation of the EpiSwitch® library. It is a two-color system with another set. The array is scanned using an Agilent SureScan scanner and the features obtained are extracted using the Agilent Feature Execution software. The data is then processed in R using the EpiSwitch ™ array processing script. This array is processed using the Bioconductor: Limma * standard two-color package at R. Array normalization is performed using Limma *'s in-array normalization function, which is performed on on-chip Agilent-positive controls and EpiSwitch ™ positive controls. Data are filtered based on Agilent Flag calls, Agilent control probes are removed, and technical replication probes are averaged for analysis using Limma *. The probe is modeled based on the differences between the two scenarios being compared and corrected using false discovery rate. For further screening, a probe with a coefficient of variation (CV) of ≤30%, ≤-1.1 or ≥1.1, and a p-value of p≤0.1FDR is used. Further multifactorial analysis is performed using the FactorMineR package in R to reduce the probe set.
* Note: LIMMA is a linear model and empirical Bayesian method for assessing differential expression in microarray experiments. Limma is an R package for the analysis of gene expression data resulting from microarrays or RNA-Seq.

プローブのプールは、最終的なピッキングのための調整p値、FCおよび<30%のCV(任意のカットオフ点)のパラメータに基づいて最初に選択される。さらなる解析および最終リストは、最初の2つのパラメータ(調整p値;FC)のみに基づいて導かれる。 The pool of probes is initially selected based on the adjusted p-value for final picking, FC and <30% CV (any cutoff point) parameters. Further analysis and final list are derived based only on the first two parameters (adjusted p-value; FC).

本明細書に記載の遺伝子
TSPYL5-TSPY様5
SRD5A1-ステロイド5α-レダクターゼ1
MAP3K1-マイトジェン活性化プロテインキナーゼキナーゼキナーゼ1
VAV3-vavグアニンヌクレオチド交換因子3
ATM-ATMセリン/スレオニンキナーゼ
SLC16A10-溶質輸送体ファミリー16メンバー10
ME3-リンゴ酸酵素3
Genes described herein TSPYL5-TSPY-like 5
SRD5A1-Steroid 5α-Reductase 1
MAP3K1-Mitegen Activated Protein Kinase Kinase Kinase 1
VAV3-vav guanine nucleotide exchange factor 3
ATM-ATM Serine / Threonine Kinase SLC16A10-Solute Transporter Family 16 Member 10
ME3-malate enzyme 3

本発明は、以下の非限定的な例によって例示される。 The present invention is exemplified by the following non-limiting examples.

例1
統計的パイプライン
EpiSwitch(商標)スクリーニングアレイを、EpiSwitch(商標)PCRプラットフォームに転換するための高い値のEpiSwitch(商標)マーカーを選択するために、RのEpiSwitch(商標)解析パッケージを使用して処理する。
Example 1
Processed using R's EpiSwitch ™ analysis package to select high-valued EpiSwitch ™ markers for converting the statistical pipeline EpiSwitch ™ screening array to the EpiSwitch ™ PCR platform. do.

工程1
プローブは、修正線形回帰モデルの産物である補正p値(偽発見率、FDR)に基づいて選択される。p値≦0.1より下のプローブが選択され、その後、それらのエピジェネティック比(ER)によってさらに縮小され、プローブERは、さらなる解析のために≦-1.1または≧1.1で選択されなければならない。最後のフィルターは変動係数(CV)であり、プローブは≦0.3より下でなければならない。
Process 1
The probe is selected based on the corrected p-value (false discovery rate, FDR), which is the product of the modified linear regression model. Probes with a p-value below ≤0.1 are selected and then further reduced by their epigenetic ratio (ER), and the probe ER is selected with ≤-1.1 or ≥1.1 for further analysis. It must be. The last filter is the coefficient of variation (CV) and the probe must be below ≤0.3.

工程2
統計リストの上位40種のマーカーは、PCR翻訳のためのマーカーとして選択するために、それらのERに基づいて選択される。最も高い負のER負荷を有する上位20種のマーカーおよび最も高い正のER負荷を有する上位20種のマーカーによりリストを形成する。
Step 2
The top 40 markers in the statistical list are selected based on their ER to be selected as markers for PCR translation. The list is formed by the top 20 markers with the highest negative ER load and the top 20 markers with the highest positive ER load.

工程3
工程1から得られたマーカーである統計的に有意なプローブは、超幾何濃縮(HE)を用いた濃縮解析のベースを形成する。この解析は、有意なプローブリストからのマーカーの縮小を可能にし、工程2のマーカーと併せて、EpiSwitch(商標)PCRプラットフォームに転換されるプローブのリストを形成する。
Process 3
The statistically significant probe, which is the marker obtained from step 1, forms the basis for enrichment analysis using hypergeometric enrichment (HE). This analysis allows for significant reduction of markers from the probe list and, together with the markers from step 2, forms a list of probes that will be converted to the EpiSwitch ™ PCR platform.

統計プローブはHEによって処理され、どの遺伝子位置が統計的に有意なプローブの濃縮を有するかを判定し、どの遺伝子位置がエピジェネティックな差の中心であるかが示される。 Statistical probes are processed by HE to determine which gene positions have statistically significant probe enrichment and indicate which gene positions are central to the epigenetic difference.

補正p値に基づく最も有意な濃縮遺伝子座を、プローブリストの生成のために選択する。p値が0.3または0.2より下の遺伝子位置を選択する。これらの遺伝子位置にマッピングされた統計的プローブは、工程2からのマーカーと共に、EpiSwitch(商標)PCR転換のための高い値のマーカーを形成する。 The most significant enriched loci based on the corrected p-value are selected for probe list generation. Select gene positions with p-values below 0.3 or 0.2. Statistical probes mapped to these gene positions, together with the markers from step 2, form high-value markers for EpiSwitch ™ PCR conversion.

アレイの設計と処理
アレイ設計
1.遺伝子座を、SIIソフトウェア(現在v3.2)を使用して次のように処理する:
a.これらの特異的遺伝子座においてゲノムの配列(50kb上流および20kb下流の遺伝子配列)を抜き出す。
b.この領域内の配列がCCsに関与する確率を規定する
c.特異的REを使用して配列を切断する。
d.どのような制限断片が特定の方向に相互作用する可能性が高いかを判定する
e.異なるCCsが相互に作用する可能性をランク付けする。
2.アレイのサイズ、したがって利用可能なプローブ位置の数(x)を決定する
3.x/4の相互作用を抜き出す。
4.各相互作用に対して、パート1の制限部位まで30bpの配列を、パート2の制限部位まで30bpの配列を規定する。これらの領域が繰り返しではないことを確認し、繰り返しであれば除外してリスト上の次の相互作用を選ぶ。両方の30bpを接合して、プロ-ブを規定する。
5.x/4プローブと規定された対照プローブのリストを作成し、4回複製してアレイ上に作り出されるリストを作成する
6.カスタムCGHアレイのAgilent Sure designウェブサイトにプローブリストをアップロードする。
7.プローブ群を使用して、AgilentカスタムCGHアレイを設計する。
Array design and processing Array design 1. The locus is processed using SII software (currently v3.2) as follows:
a. Genome sequences (gene sequences 50 kb upstream and 20 kb downstream) are extracted at these specific loci.
b. C. Defines the probability that the sequences in this region are involved in CCs. The sequence is cleaved using a specific RE.
d. Determine what restriction fragments are likely to interact in a particular direction e. Rank the likelihood that different CCs will interact.
2. 2. 2. Determine the size of the array, and thus the number of probe positions available (x). Extract the x / 4 interaction.
4. For each interaction, a sequence of 30 bp to the restriction site of Part 1 and a sequence of 30 bp to the restriction site of Part 2 are defined. Make sure these areas are not repeatable, exclude them if they are repeatable, and choose the next interaction on the list. Both 30 bp are joined to define the probe.
5. 6. Make a list of control probes defined as x / 4 probes, and make a list created on the array by duplicating 4 times. Upload the probe list to the Agilent Sure design website for your custom CGH array.
7. A group of probes is used to design an Agilent custom CGH array.

アレイ処理
1.鋳型作製のためにEpiSwitch(商標)Standard Operating Procedure(SOP)を使用してサンプルを処理する。
2.アレイ処理ラボでエタノール沈殿によりクリーンアップを行う。
3.Agilent SureTag complete DNA標識キットによるサンプルの処理-血液、細胞または組織のゲノムDNA解析酵素標識のためのAgilent Oligonucleotide Arrayに基づくCGH
4.Agilent C Scannerを使用し、Agilentの特徴抽出ソフトウェアを使用したスキャン。
Array processing 1. Samples are processed using EpiSwitch ™ Standard Operating Procedure (SOP) for mold preparation.
2. 2. Clean up by ethanol precipitation in an array processing lab.
3. 3. Sample Processing with Agilent SureTag complete DNA Labeling Kit-CGH Based on Agilent Oligonucleotide Array for Genome DNA Analysis Enzyme Labeling of Blood, Cells or Tissues
4. Scanning using Agilent C Scanner and Agilent feature extraction software.

乳がんの概要
年齢別の発生率は、浸潤性乳がんの年齢効果がアジア系人口と西洋系人口間で同様であることを示している。実際、最近の世代のアジアの乳がん率は、米国での歴史的に高い率を上回っており、アジア系人口の間の効率的な予防と治療戦略の緊急な必要性が強調されている。しかし、大規模な25年の調査の結果、マンモグラフィーは乳がん関連死亡率を低下させなかったことが示された。腫瘍が巨視的になる前の乳がんの早期発見は、がんがより治療可能なステージで医学的介入の開始を可能にすることを意味する。
Breast Cancer Overview Age-specific incidence shows that the age-effects of invasive breast cancer are similar between the Asian and Western populations. In fact, recent generations of Asian breast cancer rates have surpassed historically high rates in the United States, emphasizing the urgent need for efficient preventive and therapeutic strategies among the Asian population. However, a large 25-year study showed that mammography did not reduce breast cancer-related mortality. Early detection of breast cancer before the tumor becomes macroscopic means that it allows the initiation of medical intervention at a more treatable stage of the cancer.

EpiSwitch(商標)技術の概要
EpiSwitch(商標)プラットフォームは、異常および応答性の遺伝子発現に関連する主要な疾患のスクリーニング、早期発見、コンパニオン診断、モニタリングおよび予後分析の非常に有効な手段を提供する。このアプローチの主な利点は、非侵襲性で迅速であり、不安定なタンパク質/RNA分子ではなく、染色体シグネチャーの一部として非常に安定したDNAベースの標的に依存することである。
Overview of EpiSwitch ™ Technology The EpiSwitch ™ platform provides highly effective means of screening, early detection, companion diagnostics, monitoring and prognostic analysis of key diseases associated with abnormal and responsive gene expression. The main advantage of this approach is that it is non-invasive, rapid and relies on highly stable DNA-based targets as part of the chromosomal signature rather than unstable protein / RNA molecules.

EpiSwitch(商標)バイオマーカーシグネチャーは、複雑な疾患の表現型の層別化において高い堅牢性、感度および特異度を示す。この技術は、エピジェネティックバイオマーカーの非常に有益なクラスとして、エピジェネティックスの科学、染色体コンフォメーションシグネチャーのモニタリングおよび評価における最新のブレークスルーを利用している。学術環境に配備された現在の研究方法論は、CCSを検出するための細胞材料の生化学的処理に3~7日間を必要とする。これらの手順は感度と再現性に限界があり、さらに、設計段階でEpiSwitch(商標)解析パッケージによって提供された標的化された洞察の恩恵を受けていない。 The EpiSwitch ™ biomarker signature exhibits high robustness, sensitivity and specificity in the stratification of complex disease phenotypes. This technique utilizes the latest breakthroughs in epigenetic science, monitoring and evaluation of chromosomal conformational signatures, as a highly informative class of epigenetic biomarkers. Current research methodologies deployed in academic environments require 3-7 days for biochemical treatment of cellular materials to detect CCS. These procedures have limited sensitivity and reproducibility, and also do not benefit from the targeted insights provided by the EpiSwitch® analysis package during the design phase.

EpiSwitch(商標)解析パッケージ
EpiSwitch(商標)プラットフォーム技術は、調節の主要なエピジェネティックフレームワークの一部として、ヒト染色体の高次構造の変化を検出する。染色体の遠隔部位を並置すると、特異的なタイプのバイオマーカー-調節性染色体コンフォメーションシグネチャーが形成される。このプロセスにおける最大の課題の1つは、高次構造の一部を形成する染色体の遺伝子/遺伝子座における潜在的部位を同定することである。これは、所与の配列内の潜在的部位を同定する独自のパターン認識ソフトウェアの使用によって行われる。機械学習アルゴリズムを含むEpiSwitch(商標)解析パッケージソフトウェアは、CCSの高次構造を形成する可能性が高いDNAのパターンを特定する。
EpiSwitch ™ Analysis Package EpiSwitch ™ platform technology detects changes in higher-order structures of human chromosomes as part of a major epigenetic framework of regulation. The juxtaposition of distant sites on the chromosome forms a specific type of biomarker-regulatory chromosomal conformation signature. One of the greatest challenges in this process is identifying potential sites in genes / loci of chromosomes that form part of higher-order structures. This is done by using proprietary pattern recognition software to identify potential sites within a given sequence. EpiSwitch ™ analysis package software, including machine learning algorithms, identifies patterns of DNA that are likely to form higher-order structures of CCS.

EpiSwitch(商標)アレイによるインシリコマーカーの同定
ゲノムにわたるCCS部位は、すべての関連する層別化リードバイオマーカーの同定のために、試験コホートからの臨床サンプルについて、EpiSwitch(商標)アレイによって直接評価される。EpiSwitch(商標)アレイプラットフォームは、ハイスループット能力と多数の遺伝子座を迅速にスクリーニングする能力とのために、マーカーの同定に使用される。使用したアレイは、AgilentのカスタムCGHアレイであり、インシリコソフトウェアを介して調べるべきマーカーを同定することができる。
Identification of in silico markers by EpiSwitch ™ array CCS sites across the genome are evaluated directly by the EpiSwitch ™ array for clinical samples from the test cohort for identification of all relevant stratified lead biomarkers. .. The EpiSwitch ™ array platform is used for marker identification due to its high throughput capability and ability to rapidly screen multiple loci. The array used is an Agilent custom CGH array that can identify markers to be examined via in silico software.

EpiSwitch(商標)PCR
次いで、EpiSwitch(商標)アレイによって同定されたマーカー候補は、EpiSwitch(商標)のPCRまたはDNAシーケンサー(すなわち、Roche 454、Nanopore Minionなど)のいずれかによって検証される。統計的に有意であり、最良の再現性を示す上位のPCRマーカーは、最終的なEpiSwitch(商標)シグネチャーセットにさらに縮小されるように選択され、サンプルの独立したコホートについて検証される。EpiSwitch(商標)PCRは、確立された標準化操作手順プロトコルに従って、熟練した技術者によって実施することができる。すべてのプロトコルおよび試薬の製造は、作業の質およびプロトコルの移行能力を保証するために、ISO 13485および9001の認定に基づいて実施される。EpiSwitch(商標)PCRおよびEpiSwitch(商標)アレイバイオマーカープラットフォームは、全血および細胞株の両方の分析に適合している。この試験は、少量の血液を使用して非常に少ないコピー数における異常を検出するのに十分な感度を有する。
EpiSwitch ™ PCR
Marker candidates identified by the EpiSwitch ™ array are then validated by either the EpiSwitch ™ PCR or DNA sequencer (ie, Roche 454, Nanopore Minion, etc.). Top PCR markers that are statistically significant and show the best reproducibility are selected to be further reduced to the final EpiSwitch ™ signature set and validated for an independent cohort of samples. EpiSwitch ™ PCR can be performed by skilled technicians according to established standardized operating procedure protocols. The manufacture of all protocols and reagents is carried out under ISO 13485 and 9001 certifications to ensure the quality of work and the ability to migrate protocols. The EpiSwitch ™ PCR and EpiSwitch ™ array biomarker platforms are suitable for analysis of both whole blood and cell lines. This test is sensitive enough to detect anomalies at very low copy counts using a small amount of blood.

概要
本発明者らは、乳がん診断におけるコンパニオン診断法として使用されるバイオマーカーを同定するための基礎として、エピジェネティック染色体相互作用を使用した。EpiSwitch(商標)バイオマーカー発見プラットフォームは、乳がんに関与する表現型変化を引き起こすようなエピジェネティックな調節シグネチャーの変化を検出するために発明者らによって開発された。EpiSwitch(商標)バイオマーカー発見プラットフォームは、エピジェネティックな転写機構に環境的きっかけを統合する際の初期調節プロセスを規定するCCSを同定する。したがって、CCSは、遺伝子調節のカスケードにおける初期工程である。EpiSwitch(商標)バイオマーカー発見プラットフォームによって単離されたCCSは、いくつかの十分に文書化された利点:厳しい生化学的および生理学的安定性;それらのバイナリ特性および読出し;ならびに遺伝子調節の真核生物カスケードにおけるそれらの初期位置;を有する。
Overview We used epigenetic chromosomal interactions as the basis for identifying biomarkers used as companion diagnostics in breast cancer diagnosis. The EpiSwitch ™ biomarker discovery platform was developed by the inventors to detect changes in epigenetic regulatory signatures that cause phenotypic changes associated with breast cancer. The EpiSwitch ™ biomarker discovery platform identifies CCSs that define the initial regulatory process in integrating environmental cues into epigenetic transcriptional mechanisms. Therefore, CCS is an early step in the cascade of gene regulation. CCS isolated by the EpiSwitch ™ biomarker discovery platform has several well-documented advantages: stringent biochemical and physiological stability; their binary properties and readouts; and the eukaryote of gene regulation. They have their initial position in the biological cascade;

EpiSwitch(商標)アレイスクリーニングプラットフォームを本発明に適用し、その結果をEpiSwitch(商標)PCRプラットフォーム上に転換して、以下の目的:
1.乳がん患者と健常個体を識別するEpiSwitch(商標)マーカーの同定;
2.現行の臨床実務に関連して、感度、特異度または陽性予測値(PPV)の基準を提供する試験に発展させることができるEpiSwitch(商標)マーカーの同定;
を果たした。
The EpiSwitch ™ array screening platform was applied to the present invention and the results were converted onto the EpiSwitch ™ PCR platform for the following purposes:
1. 1. Identification of EpiSwitch ™ markers that distinguish between breast cancer patients and healthy individuals;
2. 2. Identification of EpiSwitch ™ markers that can be developed into trials that provide criteria for sensitivity, specificity or positive predictive value (PPV) in the context of current clinical practice;
Played.

この乳がんバイオマーカー発見プロジェクトでは、56,964個までの潜在的染色体コンフォメーションを4連で調査することが可能な、8×60kのアレイが利用された。8つのプールされた健常対照患者サンプルに対して個別に試験されたさまざまなバックグラウンドから8つのステージII/III乳がん患者サンプルを用いて2つのアレイを作製した。各アレイは、56,964個のEpiSwitch(商標)プローブを含んでいた。各サンプルに対するEpiSwitch(商標)鋳型を調製した。第1のアレイは、アジア系乳がんサンプルで実施した。第2のアレイは、ヨーロッパ系およびアジア系のサンプルを使用した。アジア系とヨーロッパ系の乳がんは、ER+とER-のステータスが異なる可能性がある。複数の集団において同様のがんについて重複するプローブが見出された。次いで、各プローブをデータの統計的品質について試験し、その後下記のように分析した。 This breast cancer biomarker discovery project utilized an 8x60k array capable of investigating up to 56,964 potential chromosomal conformations in quadruples. Two arrays were generated using eight stage II / III breast cancer patient samples from different backgrounds individually tested against eight pooled healthy control patient samples. Each array contained 56,964 EpiSwitch ™ probes. An EpiSwitch ™ template was prepared for each sample. The first array was performed on Asian breast cancer samples. The second array used European and Asian samples. Breast cancers of Asian and European descent may have different ER + and ER- statuses. Overlapping probes were found for similar cancers in multiple populations. Each probe was then tested for statistical quality of data and then analyzed as follows.

血液サンプルの品質管理結果
この研究で使用したサンプルはマレーシア由来であった。EpiSwitch(商標)アッセイに適した血液サンプルの生化学的品質は、ヘモグロビンによって例示されるように、サンプルの酸化およびタンパク質変性の程度によって直接影響を受ける。これらの2つのパラメータは、サンプル処理の前に血液の品質を評価する標準的な手段である。簡単に言えば、酸素化ヘモグロビン(オキシヘモグロビン)が酸化されると、メトヘモグロビンが形成され、グロビンドメインが変性するとメトヘモグロビンはヘミクロムに変換される。スペクトル変化を使用して、Winterbourn(1990)、Oxidative reactions of hemoglobin.Methods Enzymol.1990;186:265-72によって記述された、各ヘモグロビン画分の吸光係数に基づく品質管理方法によって各画分の存在量を計算した。この文書に従って、各サンプルの品質管理の一部として、血液をPBSで希釈し、分光光度計(Epoch Microplate(BioTek))で560、577および630nmにおいて分析した。3つのヘモグロビン画分のそれぞれのマイクロモル濃度を標準的な計算に従ってモニターした:μMオキシヘモグロビン=119*A577-39*A630-89*A560、μMメトヘモグロビン=28*A577+307*A630-55*A560、μMヘミクロム=-133*A577-114*A630+233*A560。オキシヘモグロビン:メトヘモグロビン比が0.75以上であることを示すサンプルが、品質管理を通過し、EpiSwitch(商標)処理に適していると考えられた。11種のサンプルは、ヘモグロビンQCを通過できず(サンプルBrCaMa132、BrCaMa136、BrCaMa137、BrCaMa147、BrCaMa164、BrCaMa165、BrCaMa166、BrCaMa167、BrCaMa168、BrCaMa169、およびBrCaMa170)、酸化および変性のそれらの生化学的状態に基づいて除外した。
Results of quality control of blood samples The samples used in this study were from Malaysia. The biochemical quality of blood samples suitable for the EpiSwitch ™ assay is directly affected by the degree of sample oxidation and protein denaturation, as exemplified by hemoglobin. These two parameters are standard means of assessing blood quality prior to sample processing. Simply put, when oxygenated hemoglobin (oxyhemoglobin) is oxidized, methemoglobin is formed, and when the globin domain is denatured, methemoglobin is converted to hemichrome. Using spectral changes, Winterborn (1990), Oxidative reactions of hemoglobin. Methods Enzymol. The abundance of each fraction was calculated by the quality control method based on the extinction coefficient of each hemoglobin fraction described by 1990; 186: 265-72. According to this document, as part of the quality control of each sample, blood was diluted with PBS and analyzed on a spectrophotometer (Epoch Microplate (BioTek)) at 560, 575 and 630 nm. The micromolar concentration of each of the three hemoglobin fractions was monitored according to standard calculations: μM oxyhemoglobin = 119 * A 577-39 * A 630-89 * A 560 , μM methemoglobin = 28 * A 577 +307 * A. 630-55 * A 560 , μM hemoglobin = -133 * A 757-114 * A 630 +233 * A 560 . Samples showing an oxyhemoglobin: methemoglobin ratio of 0.75 or higher passed quality control and were considered suitable for EpiSwitch ™ treatment. Eleven samples were unable to pass through hemoglobin QC (samples BrCaMa132, BrCaMa136, BrCaMa137, BrCaMa147, BrCaMa164, BrCaMa165, BrCaMa166, BrCaMa167, BrCaMa167, BrCaMa167, BrCaMa167, BrCaMa167, BrCaMa167, BrCaMa168, BrCaMa16 Excluded.

Figure 0007005596000001
Figure 0007005596000001

Figure 0007005596000002
Figure 0007005596000002

Figure 0007005596000003
Figure 0007005596000003

Figure 0007005596000004
Figure 0007005596000004

Figure 0007005596000005
Figure 0007005596000005

Figure 0007005596000006
Figure 0007005596000006

処理されたすべてのサンプルのエピジェネティックプロファイリングは、外れ値についての第2の品質管理を含んでいた。シップメント122(部位2バッチ2対照)は、他のすべての部位およびシップメントと基本的に異なる分布および品質を示した。外れ値制御の標準的な実施によれば、部位2バッチ2(シップメント122)からの30のサンプルは、試験の開発から除外された。 Epigenetic profiling of all processed samples included a second quality control for outliers. Shipment 122 (site 2 batch 2 control) showed a distribution and quality that was essentially different from all other sites and shipments. According to standard practices of outlier control, 30 samples from site 2 batch 2 (shipment 122) were excluded from study development.

EpiSwitch(商標)アレイの結果
・両方のデータセットは、多くの有意なプローブを生成した;
・アレイ1、BCa1 4185個の有意なEpiSwitch(商標)マーカーを、乳がん対健常対照の分析において同定した;
・アレイ2、BCa2 4856個の有意なEpiSwitch(商標)マーカーを、乳がん対健常対照の分析において同定した;
・2つの研究の間で一致した2116個の有意なプローブが、両方の分析の間で重複していた(図1参照)。
Results of EpiSwitch ™ Array -Both datasets produced many significant probes;
Array 1, BCa1 4185 significant EpiSwitch ™ markers were identified in the analysis of breast cancer vs. healthy controls;
Array 2, BCa2 4856 significant EpiSwitch ™ markers were identified in the analysis of breast cancer vs. healthy controls;
-2116 significant probes matched between the two studies overlapped between both analyses (see Figure 1).

すべてのデータを元からとり、すべての過剰に供給されたプローブを除外した。それらを、チャネル間のデータを均等にするために正規化した。各データセットの4つの複製物のすべてを一緒に組み合わせ、変動係数を決定した。2116個のプローブを、正規化された相関値を用いて絞り込み、アレイ上で最も変化した遺伝子をランク付けした。濃縮度解析を使用して、偶然よりも高い最も差次的に発現する遺伝子を見出した。全体的に、BCa1およびBCa2の組み合わせアレイからの138個のマーカーが、上方制御または下方制御された異なる発現を示した。アレイ1由来の41個のマーカーおよびアレイ2由来の39個のマーカーを含む上位80個のEpiSwitch(商標)マーカー(付録I参照)を、乳がんと健常対照との間を層別化するEpiSwitch(商標)PCRアッセイによる検証のために利用した。 All data were taken from the original and all oversupplied probes were excluded. They were normalized to equalize the data across the channels. All four duplicates of each dataset were combined together to determine the coefficient of variation. 2116 probes were filtered using normalized correlation values to rank the most altered genes on the array. Enriched uranium analysis was used to find the most differentially expressed genes that were higher than chance. Overall, 138 markers from the combination array of BCa1 and BCa2 showed different expression with upregulation or downregulation. The Top 80 EpiSwitch® Markers (see Appendix I), including 41 markers from Array 1 and 39 markers from Array 2, stratify between breast cancer and healthy controls EpiSwitch®. ) Used for verification by PCR assay.

EpiSwitch(商標)PCRプラットフォームおよびマーカー検証
プライマーは、マイクロアレイ上で同定されたマーカーからIntegrated DNA Technologies(IDT)ソフトウェア(および必要に応じてPrimer3ウェブバージョン4.0.0ソフトウェア)を用いて設計した。各プライマーセットについてプライマー試験を行った。適切なプライマーが潜在的な相互作用を研究できるように、各セットをサンプルのプールされたサブセットで試験した。プライマー試験が成功した場合、プライマーセットをスクリーニングに取り入れた。
EpiSwitch ™ PCR Platform and Marker Verification Primers were designed using Integrated DNA Technologies (IDT) software (and, optionally, Primer3 web version 4.0.0 software) from the markers identified on the microarray. A primer test was performed on each primer set. Each set was tested on a pooled subset of samples so that appropriate primers could study potential interactions. If the primer test was successful, the primer set was incorporated into the screening.

168種のサンプルを使用した。これらのサンプルを2セットに分け、118種の患者サンプル(68種のBrCaおよび50種の対照)をマーカー縮小およびモデル開発に使用し、残りの50種のサンプル(31種のBrCaおよび19種の対照)を、最初の118種の患者セットから開発された最終モデルを検証するための独立したコホートとして使用した。部位2、シップメント122(バッチ2として定義される)からの30種の対照サンプルは、品質管理手順において外れ値であることが判明したので最終的な患者セットに使用しなかった。 168 samples were used. These samples were divided into two sets, 118 patient samples (68 BrCa and 50 controls) were used for marker reduction and model development, and the remaining 50 samples (31 BrCa and 19 controls) were used. Control) was used as an independent cohort to validate the final model developed from the first 118 patient sets. Thirty control samples from Site 2, Shipment 122 (defined as Batch 2) were not used in the final patient set as they were found to be outliers in the quality control procedure.

プライマーのスクリーニング
この試験を使用して、非特異的プライマーを除外し、プライマーが3Cコンフォメーションループの検出を可能にしているかどうかを判定した。すべての抽出血液サンプルを1:2~1:64に希釈した。初期結果は、バイナリ形式、すなわち、「1」-はい、バンドが正しいサイズで存在する、または「0」-いいえ、バンドが正しいサイズで存在しない、で生成した。EpiSwitch(商標)PCRによるすべての読出しは、陽性対照および陰性対照の両方の検出を>95%の精度で行った。
Primer Screening This test was used to rule out non-specific primers and determine if the primers allowed detection of 3C conformational loops. All extracted blood samples were diluted 1: 2 to 1:64. Initial results were generated in binary format, ie "1" -yes, the band exists in the correct size, or "0" -no, the band does not exist in the correct size. All reads by EpiSwitch ™ PCR performed detection of both positive and negative controls with an accuracy of> 95%.

スクリーニング1
51種のプライマーセットがプライマー試験段階に首尾よく合格し、8種のBrCaおよび8種の対照の血液サンプルについて試験した。最初のスクリーニングでは、サンプルはアレイ上で使用されたものと一致した。
Screening 1
Fifty-one primer sets successfully passed the primer test phase and were tested on eight BrCa and eight control blood samples. In the initial screening, the samples matched those used on the array.

Figure 0007005596000007
Figure 0007005596000007

スクリーニング2
識別を示すプライマーセットを、さらに12種のBrCaおよび12種の対照の血液サンプルでスクリーニングした。アッセイ感度の範囲を同定するために、1:2~1:64希釈系列を使用した。スクリーニング1および2の結果を併合して、使用した20種のサンプルすべての完全な表示を得た。さらに24種のBrCaおよび24種の対照および最後に残りのサンプルを試験した。
Screening 2
An identification primer set was further screened with 12 BrCa and 12 control blood samples. A 1: 2 to 1:64 dilution series was used to identify the range of assay sensitivities. The results of screenings 1 and 2 were merged to give a complete indication of all 20 samples used. An additional 24 BrCa and 24 controls and finally the remaining samples were tested.

スクリーニング3
最終的な20種のBrCaおよび20種の対照サンプルを、各プライマーセットに対するアッセイの検出感度範囲に及ぶ最も有益な3つの希釈液を用いてスクリーニングした。最終的な20のサンプルのスクリーニングに合計13種のマーカーを使用した。スクリーニング3の結果を90種のBrCaおよび90の種の対照のサンプルと併合して、BrCaおよび対照の両方に使用された100種のサンプルの完全な表示を得た。次いで、BrCa患者と対照サンプルとの識別の有効性について試験した。カイ2乗検定(フィッシャーの正確検定)を作成し、最終的なマーカーを得た。
Screening 3
The final 20 BrCa and 20 control samples were screened with the three most beneficial diluents that ranged the detection sensitivity of the assay for each primer set. A total of 13 markers were used to screen the final 20 samples. The results of Screen 3 were merged with 90 BrCa and 90 control samples to give a complete indication of the 100 samples used for both BrCa and controls. The effectiveness of discrimination between BrCa patients and control samples was then tested. A chi-square test (Fisher's exact test) was created and the final marker was obtained.

Figure 0007005596000008
Figure 0007005596000008

希釈係数3と組み合わせた13種のプライマーによる39種のマーカーのマーカー縮小
最終的に選択された13の位置および39種のマーカーを作業分類モデルに縮小するために、R統計的言語を用いるGLMNETパッケージを使用した。GLMNETは、リッジまたはlasso回帰(マーカーの共直線性を省略)を可能にするペナルティ付(elastic-netペナルティ)回帰モデルを実行する。lasso回帰を用いた多変量ロジスティック回帰分析を患者セット1について行った。[図3を参照]
Marker reduction of 39 markers with 13 primers combined with dilution factor 3 GLMNET package using R statistical language to reduce the finally selected 13 positions and 39 markers to a working classification model It was used. GLMNET carries out a penalty (elastic-net penalty) regression model that allows for ridge or lasso regression (omitting marker co-linearity). Multivariate logistic regression analysis using lasso regression was performed on patient set 1. [See Fig. 3]

Figure 0007005596000009
Figure 0007005596000009

ロジスティック回帰分析
Waikato to Knowledge Analysis(WEKA)ソフトウェアバージョン3.6.12を使用してロジスティック回帰分析を行った。この分析を用いて、患者セット1(118種の患者、68種のBrCaおよび50種の対照)について、感度および特異度の分類関数が確立され、GLMNET分析によって8つのマーカーを同定した。
Logistic Regression Analysis Logistic regression analysis was performed using Waikato to Knowledge Analysis (WEKA) software version 3.6.12. Using this analysis, sensitivity and specificity classification functions were established for patient set 1 (118 patients, 68 BrCa and 50 controls) and eight markers were identified by GLMNET analysis.

Figure 0007005596000010
Figure 0007005596000010

モデル検証
次いで、8つのマーカーのロジスティックモデルを患者セット2(31種のBrCaおよび19種の対照)で試験したが、これらの患者はマーカーを縮小させるために使用しない、独立したデータセットである。
Model validation Next, a logistic model of 8 markers was tested on patient set 2 (31 BrCa and 19 controls), but these patients are independent datasets that are not used to shrink the markers.

Figure 0007005596000011
Figure 0007005596000011

主成分分析(PCA)は、複雑なデータセットを簡素化するための探索的多変量統計解析技術である。n個の変数に対してm個の観測値を与えると、PCAの目的は、nより小さい新しいr個の変数を見つけることによってデータ行列の次元数を減らすことである。主成分と呼ばれるこれらの新しい変数rは、相互に相関関係なく直交しながら、元の変数nの分散の大部分を可能な限り多く占める。各主成分は、元の変数の線形結合であるため、多くの場合、構成要素の表す意味に帰することができる。主成分分析は、外れ値遺伝子の探索におけるマイクロアレイデータの分析ならびに他のタイプの発現データの分析を含む広範な生物医学的問題に使用されてきた。 Principal component analysis (PCA) is an exploratory multivariate statistical analysis technique for simplifying complex data sets. Given m observations for n variables, the purpose of the PCA is to reduce the number of dimensions of the data matrix by finding new r variables smaller than n. These new variables r, called principal components, occupy as much of the variance of the original variable n as possible, while being orthogonal to each other and orthogonal to each other. Since each principal component is a linear combination of the original variables, it can often be attributed to the meaning of the components. Principal component analysis has been used for a wide range of biomedical problems, including analysis of microarray data in the search for outlier genes as well as analysis of other types of expression data.

Figure 0007005596000012
Figure 0007005596000012

Figure 0007005596000013
Figure 0007005596000013

Figure 0007005596000014
Figure 0007005596000014

Figure 0007005596000015
Figure 0007005596000015

Figure 0007005596000016
Figure 0007005596000016

結論
品質管理手順により、他の部位およびシップメントからの他のすべてのサンプルとプロファイルおよび品質が根本的に異なるサンプルとして、シップメント122(部位2 対照)を同定し、除外した。EpiSwitch(商標)方法論による結果の染色体コンフォメーション分析およびロジスティック回帰は、85.7%の感度、80%の特異度、85.7%のPPVおよび80%のNPVの交差検定結果を有する乳がん患者および健常対照の118種のサンプルを層別化した8つのバイオマーカーのシグネチャーを開発した。50種のサンプルの独立コホート検証は、83.3%の感度、100%の特異度、100%のPPVおよび80%のNPVのバイオマーカーを示した。
CONCLUSIONS The quality control procedure identified and excluded shipment 122 (site 2 control) as a sample that was radically different in profile and quality from all other samples from other sites and shipments. Chromosome conformational analysis and logistic regression of the results of the EpiSwitch ™ methodology show breast cancer patients with 85.7% sensitivity, 80% specificity, 85.7% PPV and 80% NPV cross-validation results. Eight biomarker signatures were developed by stratifying 118 healthy control samples. Independent cohort validation of 50 samples showed biomarkers of 83.3% sensitivity, 100% specificity, 100% PPV and 80% NPV.

Figure 0007005596000017
Figure 0007005596000017

Figure 0007005596000018
Figure 0007005596000018

Figure 0007005596000019
Figure 0007005596000019

Figure 0007005596000020
Figure 0007005596000020

Figure 0007005596000021
Figure 0007005596000021

Figure 0007005596000022
Figure 0007005596000022

上の表9の3つのセクションは、マーカーセット1の最終的な8つのマーカーについての情報を提供している。 The three sections of Table 9 above provide information about the final eight markers in marker set 1.

Figure 0007005596000023
Figure 0007005596000023

例2
オックスフォードバイオダイナミックス(OBD)は異常な遺伝子発現およびエピジェネティクスの分野における特許取得済みのプラットフォーム技術を提供するヘルスケアサービス会社である。特許取得済みのEpiSwitch(商標)プラットフォーム技術は、エピジェネティックな調節シグネチャーの変化を検出する。EpiSwitch(商標)バイオマーカー発見プラットフォームは、エピジェネティックおよび転写機構に環境的きっかけを組み込む際の初期調節プロセスを定義する染色体コンフォメーションシグネチャー(CCS)を同定する。したがって、CCSは、遺伝子調節のカスケードにおける初期工程である。
Example 2
Oxford Biodynamics (OBD) is a healthcare services company that provides patented platform technologies in the areas of aberrant gene expression and epigenetics. The patented EpiSwitch ™ platform technology detects changes in epigenetic regulatory signatures. The EpiSwitch ™ biomarker discovery platform identifies the Chromosome Conformation Signature (CCS), which defines the initial regulatory processes for incorporating environmental cues into epigenetic and transcriptional mechanisms. Therefore, CCS is an early step in the cascade of gene regulation.

EpiSwitch(商標)バイオマーカー発見プラットフォームによって単離されたCCSは、いくつかの利点:
→厳しい生化学的および生理学的安定性;
→それらのバイナリ特性および読出し;
→遺伝子調節の真核生物カスケードにおけるそれらの初期位置;
を有する。
CCS isolated by the EpiSwitch ™ biomarker discovery platform has several advantages:
→ Severe biochemical and physiological stability;
→ Their binary properties and reads;
→ Their initial position in the eukaryotic cascade of gene regulation;
Have.

遺伝子座における特定のコンフォメーションシグネチャーは、病理学または治療に関連する調節的なエピジェネティック制御の設定により、存在または非存在となる。CCSは軽度の解離速度を有し、特定の表現型または病理を表す場合、それらは、新しい表現型への生理学的なシグナル伝達により、または外部介入の結果としてのみ変化する。さらに、これらの事象の測定値はバイナリであるため、この読出しは、DNAメチル化、ヒストン修飾およびほとんどの非コードRNAのさまざまなレベルの連続読出しとは著しく対照的である。現在までの用いられている大部分の分子バイオマーカーについての連続読出しは、特定のバイオマーカーの変化の大きさが患者によって大きく変動するという点で、データ分析に困難な課題を提供し、患者を層別化するために使用される分類統計に問題を引き起こす。これらの分類統計および推論アプローチは、大きさの欠けているバイオマーカーの使用によくて適しており、表現型の違いの「はい または いいえ」バイナリスコアを提供し、EpiSwitch(商標)CCSバイオマーカーが、潜在的な診断、予後および予測バイオマーカーのための優れた供給源であることを示す。 Certain conformational signatures at loci are present or absent, depending on the setting of pathological or therapeutic-related regulatory epigenetic controls. CCS have a mild rate of dissection, and if they represent a particular phenotype or pathology, they change only by physiological signaling to the new phenotype or as a result of external intervention. Moreover, since the measurements of these events are binary, this read is in sharp contrast to DNA methylation, histone modifications and continuous reads of various levels of most non-coding RNAs. Continuous readouts of most of the molecular biomarkers used to date pose a difficult challenge to data analysis in that the magnitude of change in a particular biomarker varies widely from patient to patient. Causes problems with the classification statistics used for stratification. These classification statistics and inference approaches are well suited for the use of biomarkers lacking size, providing "yes or no" binary scores for phenotypic differences, and the EpiSwitch ™ CCS biomarkers. , Shows that it is an excellent source for potential diagnostic, prognostic and predictive biomarkers.

OBDは、一次および二次罹患組織との高い一致および有力な検証結果により、その開発されたすべての適用において、EpiSwitch(商標)マーカーが非常に広まっていることを一貫して観察してきた。EpiSwitch(商標)バイオマーカーシグネチャーは、複雑な疾患の表現型の層別化において高い堅牢性、および高い感度および特異度を示す。OBD技術は、エピジェネティクスの科学における最新の進歩を利用しており、エピジェネティックバイオマーカーの非常に有益なクラスとして、染色体コンフォメーションシグネチャーの発見、モニタリング、および評価のためのユニークで唯一の工業品質のISO認証プラットフォームを提供する。 OBD has consistently observed that the EpiSwitch ™ marker is very widespread in all its developed applications, with high concordance with primary and secondary affected tissues and strong validation results. The EpiSwitch ™ biomarker signature exhibits high robustness, high sensitivity and specificity in the stratification of complex disease phenotypes. OBD technology leverages the latest advances in epigenetic science and is a unique and unique industry for the discovery, monitoring, and evaluation of chromosomal conformational signatures as a highly informative class of epigenetic biomarkers. Provides a quality ISO certification platform.

EpiSwitch(商標)技術は、異常および応答性の遺伝子発現に関連する主要な疾患のスクリーニング、早期発見、コンパニオン診断、モニタリングおよび予後分析の非常に有効な手段を提供する。OBDアプローチの主な利点は、非侵襲性で迅速であり、不安定なタンパク質/RNA分子ではなく、染色体シグネチャーの一部として非常に安定したDNAベースの標的に依存することである。 EpiSwitch ™ technology provides highly effective means of screening, early detection, companion diagnostics, monitoring and prognostic analysis of key diseases associated with abnormal and responsive gene expression. The main advantage of the OBD approach is that it is non-invasive, rapid and relies on highly stable DNA-based targets as part of the chromosomal signature rather than unstable protein / RNA molecules.

技術概要
CCSは、エピジェネティックな制御の安定した調節フレームワークを形成し、細胞の全ゲノムにわたる遺伝情報にアクセスする。CCSの変化は、結果が明らかな異常として現れる前に、調節様式および遺伝子発現の早期変化を反映する。CCSの簡単な考え方は、DNAの異なる遠隔調節部分が、近接して互いの機能に影響を与えるトポロジカルな配置であることである。これらの接続はランダムに行われるわけではなく、それらは高度に調節され、有意なバイオマーカー層別化力を有する高レベルの調節機構として十分に認識されている。適用されたエピジェネティクスの急速に発展している分野では、CCSは代替のバイオマーカープラットフォームに対して大きな利点を提供する。新しいバイオマーカーの実体として、CCSの発見、モニタリングおよび検証は、品質、安定性、感度、再現性、コストおよび操作回転率の性能に関して業界が許容する技術を必要とする。
Technical Overview CCS forms a stable regulatory framework for epigenetic regulation and accesses genetic information across the cell's genome. Changes in CCS reflect early changes in regulatory modalities and gene expression before the results manifest themselves as overt abnormalities. The simple idea of CCS is that different remote control parts of DNA are in a topological arrangement that closely affects each other's function. These connections are not random and they are highly regulated and well recognized as high level regulatory mechanisms with significant biomarker stratification. In the rapidly evolving field of applied epigenetics, CCS offers significant advantages over alternative biomarker platforms. As a new biomarker entity, the discovery, monitoring and validation of CCS requires industry-accepted technology for quality, stability, sensitivity, reproducibility, cost and operational turnover performance.

ゲノムにわたってCCSの高次構造を形成する可能性が高いDNAは、すべての関連する層別リードバイオマーカーの同定のための試験コホートからの臨床サンプルについてEpiSwitch(商標)アレイによって直接評価される。EpiSwitch(商標)アレイスクリーニングの後、統計的に有意な層別化バイオマーカーのプールは通常300リードを超える。次いでいくつかのリードがEpiSwitch(商標)CRに転換される。層別化バイオマーカーの最小シグネチャー(<15)は標準的な検証を受け、一度確認され、検証されたシグネチャーはバイナリCCSを含み、これは特定の病理を有する患者においてエピジェネティックな調節の条件バイオマーカーとして存在するか、または非存在である。OBD技術は、エピジェネティクスの科学における最新の進歩を利用しており、染色体コンフォメーションシグネチャーの発見、モニタリング、および評価のためのユニークで唯一の工業品質のISO認証プラットフォームを提供する。 DNA that is likely to form higher-order structures of CCS across the genome is evaluated directly by the EpiSwitch ™ array for clinical samples from the test cohort for the identification of all relevant stratified lead biomarkers. After EpiSwitch ™ array screening, the pool of statistically significant stratified biomarkers typically exceeds 300 reads. Several leads are then converted to EpiSwitch ™ CR. The minimal signature of the stratified biomarker (<15) has undergone standard validation, once confirmed, and the validated signature contains binary CCS, which is a condition of epigenetic regulation in patients with a particular pathology. It exists as a marker or does not exist. OBD technology leverages the latest advances in the science of epigenetics to provide a unique and only industrial quality ISO certification platform for the discovery, monitoring and evaluation of chromosomal conformational signatures.

EpiSwitch(商標)アッセイ
臨床サンプルの独自の生化学処理によりエピジェネティックCCSバイオマーカーの配列ベースの分析物への迅速かつ効果的な(4時間未満)変換が得られ、次いでこれがEpiSwitch(商標)アレイ(Agilent CGHアレイプラットフォームの改訂バージョン)、EpiSwitch(商標)PCRまたはDNAシーケンサー、すなわちRoche 454、Nanopore Minionなどにより読み出される。
EpiSwitch ™ Assay A unique biochemical treatment of clinical samples results in rapid and effective (less than 4 hours) conversion of epigenetic CCS biomarkers to sequence-based analytes, followed by the EpiSwitch ™ array ( Revised version of the Agilent CGH Array Platform), EpiSwitch ™ PCR or DNA sequencer, ie Roche 454, Nanopore Minion, etc.

EpiSwitch(商標)アレイ分析
EpiSwitch(商標)アレイプラットフォームは、ハイスループットで多数の遺伝子座を迅速にスクリーニングできる能力のため、マーカーの同定に使用される。このプロジェクトで使用されているアレイは、Agilentのカスタム-CGHアレイであり、これによりOBDはインシリコソフトウェアで同定されたマーカーを調べることができる。
EpiSwitch ™ Array Analysis The EpiSwitch ™ Array Platform is used for marker identification due to its ability to rapidly screen large numbers of loci at high throughput. The array used in this project is Agilent's custom-CGH array, which allows OBD to look up markers identified in in silico software.

このプロジェクトは、15KのEpiSwitch(商標)アレイを使用してグループ1(ステージI、II、IIIおよびIV)からのサンプルを有するアレイを用いて実施するが、分析の範囲を広げるために、サンプルは異なる民族性と併せて使用し、アレイから供給されるデータの幅を広げた。その代わりに、2つの8x60kアレイを使用し、これにより、最大56,964の潜在的染色体コンフォメーションを4連に調べることができるので、このプロジェクトでは60kのアレイを使用した。これを使用して、最大14,000のプローブで染色体コンフォメーションシグネチャーを4連に見ることができる。8種のプールされた健常対照患者サンプルに対して個別に試験されたさまざまなバックグラウンドから8種のステージII/III乳がん患者サンプルを用いて2つのアレイを作製した。各サンプルに対するEpiSwitch(商標)鋳型を調製した。第1のアレイは、OBDによって調達されたアジア系乳がんサンプルについて実施した。第2のアレイはポーランド系コホートと独立したアジア系サンプルコホートとを使用した。アジア系およびヨーロッパ系の乳がんは、ER+およびER-の状態の間、ならびに他のサブタイプの罹患率およびエピジェネティックプロファイルが異なる可能性がある。複数の集団において同様のがんについて重複するプローブが見出された。 This project will be carried out using an array with samples from Group 1 (Stages I, II, III and IV) using a 15K EpiSwitch ™ array, but to broaden the scope of analysis, the samples will be Used in conjunction with different ethnicities, broadened the range of data supplied by the array. Instead, two 8x60k arrays were used, which allowed up to 56,964 potential chromosomal conformations to be examined in quadruples, so a 60k array was used in this project. It can be used to view chromosomal conformational signatures in quadruples with up to 14,000 probes. Two arrays were generated using 8 stage II / III breast cancer patient samples from different backgrounds individually tested against 8 pooled healthy control patient samples. An EpiSwitch ™ template was prepared for each sample. The first array was performed on Asian breast cancer samples procured by OBD. The second array used a Polish cohort and an independent Asian sample cohort. Breast cancers of Asian and European descent may differ between ER + and ER- statuses, as well as morbidity and epigenetic profiles of other subtypes. Overlapping probes were found for similar cancers in multiple populations.

分析の主な結果は、
・両方のデータセットは、多くの有意なプローブを生成した;
・アレイ1、BrCa1 4185個の有意なEpiSwitch(商標)マーカーを、乳がん対健常対照の分析において同定した;
・アレイ2、BrCa2 4856個の有意なEpiSwitch(商標)マーカーを、乳がん対健常対照の分析において同定した;
・2つの研究の間で一致した2116種の有意なプローブが、両方の分析の間で重複していた;
であった。
The main result of the analysis is
-Both datasets produced many significant probes;
Array 1, BrCa1 4185 significant EpiSwitch ™ markers were identified in the analysis of breast cancer vs. healthy controls;
Array 2, BrCa2 4856 significant EpiSwitch ™ markers were identified in the analysis of breast cancer vs. healthy controls;
2116 significant probes that were consistent between the two studies overlapped between both analyses;
Met.

図1は、BrCa1(表11)およびBrCa2(表12、ポーランド系コホートを含む)アレイからの有意なプローブの比較を示す。プローブはp値<0.05に調整した。 FIG. 1 shows a comparison of significant probes from BrCa1 (Table 11) and BrCa2 (Table 12, including Polish cohort) arrays. The probe was adjusted to p-value <0.05.

すべてのデータを元からとり、すべての過剰に供給されたプローブを除外した。チャネル間のデータを均等にするために正規化を行った。各データセットの4つすべての複製物を一緒に組み合わせ、変動係数を決定した。2116個のプローブを、正規化された相関値を用いて絞り込み、アレイ上で最も変化した遺伝子をランク付けした。濃縮度解析を使用して、偶然よりも高い最も差次的に発現する遺伝子を見出した。したがって、全体的に、BrCa1およびBrCa2の組み合わせアレイからの138個のマーカーが、差次的な上方制御または下方制御された発現を示した。アレイで使用したサンプルは可能な限り年齢が近くなるようにあわせ、アレイは年齢範囲33~68歳、アレイ2は32~65歳であった。 All data were taken from the original and all oversupplied probes were excluded. Normalization was performed to equalize the data between channels. All four duplicates of each dataset were combined together to determine the coefficient of variation. 2116 probes were filtered using normalized correlation values to rank the most altered genes on the array. Enriched uranium analysis was used to find the most differentially expressed genes that were higher than chance. Thus, overall, 138 markers from the BrCa1 and BrCa2 combination array showed differential upregulated or downregulated expression. The samples used in the array were adjusted to be as close in age as possible, with the array having an age range of 33-68 years and the array 2 having an age range of 32-65 years.

Figure 0007005596000024
Figure 0007005596000024

Figure 0007005596000025
Figure 0007005596000025

スクリーニング1、EpiSwitch(商標)マーカーの検証
EpiSwitch(商標)PCRアッセイは、標準化された操作手順プロトコルに従って、熟練した技術者によって実施することができる分子生物学的試験である。すべてのプロトコルおよび試薬製造は、作業の質およびプロトコルの伝達能力を保証するために、ISO 13485および9001の仕様書に従って実施される。
Screening 1, Verification of EpiSwitch ™ Markers The EpiSwitch ™ PCR assay is a molecular biological test that can be performed by a skilled technician according to standardized operating procedure protocols. All protocol and reagent manufacturing is carried out in accordance with ISO 13485 and 9001 specifications to ensure the quality of work and the ability of the protocol to be transmitted.

プライマーは、マイクロアレイにより同定されたマーカーからIntegrated DNA Technologies(IDT)ソフトウェア(および必要に応じてPrimer3ウェブバージョン4.0.0ソフトウェア)を用いて設計した。サンプルの品質管理は、抽出された単一サンプルについてMMP1プライマーを用いて実施した。すべてのサンプルは、MMP1について陽性の結果を示し、これらのサンプルはEpiSwitch(商標)PCRに続けることが可能であった。すべての抽出血液サンプルを1:2~1:64に希釈し、ネステッドPCRを実施した。初期結果は、バイナリ形式、すなわち、「1」-はい、バンドが正しいサイズで存在する、または「0」-いいえ、バンドが正しいサイズで存在しない、で生成した。 Primers were designed using Integrated DNA Technologies (IDT) software (and, optionally, Primer3 web version 4.0.0 software) from the markers identified by the microarray. Sample quality control was performed with the MMP1 primer on the extracted single sample. All samples showed positive results for MMP1 and these samples could be followed by EpiSwitch ™ PCR. All extracted blood samples were diluted 1: 2 to 1: 64 and nested PCR was performed. Initial results were generated in binary format, ie "1" -yes, the band exists in the correct size, or "0" -no, the band does not exist in the correct size.

統計解析後、アレイ1由来の41個のマーカーおよびアレイ2由来の39個のマーカーを含む上位80個のEpiSwitch(商標)マーカーを、乳がんサンプルの間を層別化するEpiSwitch(商標)PCRアッセイによる検証のために利用した。 After statistical analysis, the top 80 EpiSwitch ™ markers, including 41 markers from Array 1 and 39 markers from Array 2, are stratified between breast cancer samples by the EpiSwitch ™ PCR assay. Used for verification.

8種のBrCaおよび8種の対照サンプルのスクリーニングの第1ラウンドの後、マーカーを51種に縮小し、第2ラウンドはさらに36種のBrCaおよび36つの対照サンプルを使用し、マーカーをBrCaと対照患者との間を層別化できる13個の良好なマーカー(表13)に縮小した。 After the first round of screening for 8 BrCa and 8 control samples, the markers were reduced to 51, and in the second round an additional 36 BrCa and 36 control samples were used to control the markers with BrCa. It was reduced to 13 good markers (Table 13) that could be stratified with the patient.

Figure 0007005596000026
Figure 0007005596000026

スクリーニング2、GliwiceサンプルについてのEpiSwitch(商標)PCR検証
スクリーニングは、50のGliwiceサンプルおよび22の対照サンプルについて13の良好なマーカーを用い、1:2~1:64の希釈系列を用いて行った。バイナリデータの結果については、付録の表18を参照されたい。スクリーニング実施後、最終マーカーを得るために、カイ2乗検定(フィッシャーの正確検定)の使用によって対照サンプルからBrCaを識別する有効性についてバイナリ結果を試験した。
Screening 2, EpiSwitch ™ PCR Verification for Gliwice Samples Screening was performed with 13 good markers for 50 Gliwice samples and 22 control samples, using a dilution series of 1: 2 to 1:64. See Table 18 in the Appendix for the results of the binary data. After screening, binary results were tested for the effectiveness of identifying BrCa from control samples by using a chi-square test (Fisher's exact test) to obtain final markers.

次いで、GLMNETおよびベイズロジスティックモデリング統計を用いて13個のマーカーの結果を評価した。次いで、良好なスコアを有する10個のマーカー(表4)を強調した。 The results of 13 markers were then evaluated using GLMNET and Bayesian logistic modeling statistics. The 10 markers with good scores (Table 4) were then highlighted.

Figure 0007005596000027
Figure 0007005596000027

追加の統計解析によりマーカーをさらに縮小した。24種のサンプルを使用する、66%のトレーニングセットおよび34%のテストセットを有する分類ランダムツリーを使用した。 The markers were further reduced by additional statistical analysis. A classification random tree with 66% training set and 34% test set using 24 samples was used.

正確に分類されたインスタンスは19(79.1667%)であり、誤って分類されたインスタンスは5(20.8333%)であり、これはカッパ統計量0.5および平均絶対誤差0.2322をもたらした。平均絶対誤差は0.4656であり、相対絶対誤差は55.2934%であり、二乗平方根誤差は108.4286%であった The correctly classified instances were 19 (79.1667%) and the misclassified instances were 5 (20.8333%), which had a kappa statistic of 0.5 and a mean absolute error of 0.2322. Brought. The mean absolute error was 0.4656, the relative absolute error was 55.2934%, and the root mean square error was 108.4286%.

Figure 0007005596000028
Figure 0007005596000028

最終的な8個のマーカーを、GLMNETを使用して生成した The final 8 markers were generated using GLMNET

Figure 0007005596000029
Figure 0007005596000029

サンプルの独立した分類
最終段階では、ロジスティックモデリングおよび5分割交差検証を使用して、25のサンプルの独立したコホートについてマーカーの層別化を試験した。
Independent classification of samples In the final stage, marker stratification was tested on an independent cohort of 25 samples using logistic modeling and 5-fold cross-validation.

Figure 0007005596000030
Figure 0007005596000030

これは、独立したコホート検証において、分類子が、83.6%の感度および91.0%の特異度およびROC値0.903が可能な選択マーカーに基づくことを示す。これは、バイナリ分類子の性能が高い基準であることを意味し、ROCは最高1であり、最低0.5である。 This indicates that in an independent cohort validation, the classifier is based on a selectable marker capable of 83.6% sensitivity and 91.0% specificity and ROC value of 0.903. This means that the performance of the binary classifier is a high criterion, with a maximum ROC of 1 and a minimum of 0.5.

結論
この研究の目的は、乳がんを有する、または乳がんの素因がある女性の全血におけるエピジェネティックな変化を判定し、次にバイオマーカーを診断的層別化に使用することであった。
CONCLUSIONS The purpose of this study was to determine epigenetic changes in whole blood of women with or predisposed to breast cancer, and then to use biomarkers for diagnostic stratification.

対照患者からの乳がん患者の診断と関連して、56964個の染色体相互作用候補を調べるために、60KのEpiSwitch(商標)アレイが開発された。 A 60K EpiSwitch ™ array was developed to examine 56964 chromosomal interaction candidates in connection with the diagnosis of breast cancer patients from control patients.

アジア系のBrCaと対照の患者サンプルを有する第1のアレイ、アジア系とポーランド系のBrCaサンプル、および対照サンプルを有する第2のアレイの2つのアレイを作製し、これは2つのアレイ間に任意の類似のマーカーがあるかどうかを確認可能にするものであった。これは最終的に、異なる民族群間でマーカーのより奥深い発見を可能にする。アレイ分析の後、4185個および4856個のプローブが見出され、2116個の有意なプローブが重複していた。プローブの補正、正規化を行い、対照患者から乳がんの診断を決定するために使用できる138個のマーカー候補を見出した。さらなる統計的縮小を行い、PCRスクリーニングを行う上位80個のマーカーを生成した。数回のスクリーニングの後、13個のマーカーが、それらのスクリーニング力に堅牢性を示し、それぞれ0.3以上のp値を有した。これらの13個のマーカーを使用して、その後Memorial Cancer Center and Institute of Oncology、Gliwice Branch(IOG)からの50種のBrCaサンプル、および22種の対照患者サンプルをスクリーニングした。段階希釈の後、ネステッドPCRスクリーニングを行い、次いでバイナリ読出しを分析し、どのマーカーがBrCaと対照とを識別できるかを判定して、最終的に8個のマーカーを絞り込んだ。表16を参照されたい。 Two arrays were made, a first array with Asian BrCa and control patient samples, an Asian and Polish BrCa sample, and a second array with control samples, which is optional between the two arrays. It was possible to confirm whether there was a similar marker in. This ultimately allows for deeper discovery of markers between different ethnic groups. After array analysis, 4185 and 4856 probes were found, with 2116 significant probes overlapping. The probe was corrected and normalized to find 138 marker candidates that could be used to determine the diagnosis of breast cancer from control patients. Further statistical reductions were performed to generate the top 80 markers for PCR screening. After several screenings, 13 markers showed robustness in their screening power, each with a p-value of 0.3 or greater. These 13 markers were then used to screen 50 BrCa samples from the Memorial Cancer Center and Institute of Oncology, Gliwice Branch (IOG), and 22 control patient samples. After serial dilution, nested PCR screening was performed, then binary reads were analyzed to determine which markers could distinguish BrCa from the control, and finally 8 markers were narrowed down. See Table 16.

Figure 0007005596000031
Figure 0007005596000031

分析の最終段階は、8個のマーカーが対照患者からの乳がん患者の診断に使用できるかどうかを判定することであった。マーカーがサンプルを正しく予測できるかどうかを判断するために、25種のサンプルの独立したサブセットを使用してロジスティックモデリングを実行した。25種のサンプルのうち、これらのマーカーは83.6%の感度および91.0%の特異度を示し、ROC値は0.903であった。 The final step in the analysis was to determine if the eight markers could be used to diagnose breast cancer patients from control patients. Logistic modeling was performed using an independent subset of 25 samples to determine if the markers could predict the samples correctly. Of the 25 samples, these markers showed 83.6% sensitivity and 91.0% specificity with a ROC value of 0.903.

EpiSwitch(商標)スクリーニングによって見出されたマーカーはまた、がん診断における興味深い特徴を示す。血管拡張性失調症変異キナーゼ(ATM)はDNA損傷応答に重要な役割を果たし、機能の喪失は癌の発症につながる可能性があり、それらはまた、持続的な腫瘍増殖においてシグナル伝達経路に関連している。ATMは、陽性乳がん細胞株におけるHER2(ヒト表皮成長因子受容体2)の腫瘍形成能を促進する。ATMは、HSP90(熱ショックタンパク質)およびHER2を有する三量体化合物に関与し、いくつかの腫瘍において同定されている。乳がんの重大なリスクは、CHEK2、PALB2およびTP53に関連しており、ATMの突然変異で中程度のリスクがある。 Markers found by EpiSwitch ™ screening also show interesting features in cancer diagnosis. Vascular diastolic ataxia mutant kinases (ATMs) play an important role in DNA damage response, loss of function can lead to the development of cancer, and they are also associated with signaling pathways in sustained tumor growth. is doing. ATM promotes the ability of HER2 (human epidermal growth factor receptor 2) to form tumors in positive breast cancer cell lines. ATM is involved in trimer compounds with HSP90 (heat shock protein) and HER2 and has been identified in several tumors. A significant risk of breast cancer is associated with CHEK2, PALB2 and TP53, with a moderate risk of ATM mutations.

遺伝子SLC16A10、溶質輸送体ファミリー16(芳香族アミノ酸トランスポーター)、メンバー10は、腎臓、肝臓および腸で強く発現することが知られている、芳香族アミノ酸を選択的に輸送するNa+非依存性トランスポーターシステムであるシステムTに関与する。その関連経路には、グルコースおよび他の糖、胆汁酸塩および有機酸、金属イオンおよびアミン化合物の輸送、タンパク質の消化および吸収がある。この遺伝子に関連するGOアノテーションには、トランスポーター活性が含まれる。ユニポーターTAT1(Slc16a10)は、特定の膜を横切るAAAの濃度を平衡させるために必要である。 Gene SLC16A10, solute transporter family 16 (aromatic amino acid transporter), member 10 is a Na + independent trans that selectively transports aromatic amino acids, known to be strongly expressed in the kidneys, liver and intestines. Involved in system T, which is a porter system. Related pathways include the transport of glucose and other sugars, bile salts and organic acids, metal ions and amine compounds, and the digestion and absorption of proteins. GO annotations associated with this gene include transporter activity. Uniporter TAT1 (Slc16a10) is required to equilibrate the concentration of AAA across a particular membrane.

Vav3は、前立腺癌の腫瘍形成において重要な役割を果たす癌遺伝子であり、乳がんにおいても発現および上方制御される。Vavタンパク質は、RhoファミリーのGTPaseのグアニンヌクレオチド交換因子である。それらは、細胞シグナル伝達および腫瘍形成に関与している。Vav3は細胞の成長および増殖を促進する。乳がんおよび前立腺癌は、それらの成長がそれぞれのホルモン受容体によって媒介されるホルモン非依存性腫瘍である。Vav3は、乳がんの発生においてエピジェネティックに調節される。 Vav3 is an oncogene that plays an important role in the tumorigenesis of prostate cancer and is also expressed and upregulated in breast cancer. The Vav protein is a guanine nucleotide exchange factor for the Rho family of GTPases. They are involved in cell signaling and tumorigenesis. Vav3 promotes cell growth and proliferation. Breast and prostate cancers are hormone-independent tumors whose growth is mediated by their respective hormone receptors. Vav3 is epigenetic regulated in the development of breast cancer.

MSH3、MutSホモログ3は、結腸直腸癌、乳がん、前立腺癌、膀胱癌、甲状腺癌、卵巣癌および食道癌などのいくつかの異なるタイプのがんと関連している。ミスマッチ修復経路は、細胞周期調節、アポトーシスおよびDNA損傷に関与する。ヒトには7つのミスマッチ修復遺伝子があり、MSH3遺伝子に関しては180のSNPが報告されている。MSH3タンパク質発現の喪失は結腸直腸癌に関連し、多型rs26279Gは乳がんのリスクと関連している。 MSH3, MutS homolog 3 is associated with several different types of cancer such as colorectal cancer, breast cancer, prostate cancer, bladder cancer, thyroid cancer, ovarian cancer and esophageal cancer. Mismatch repair pathways are involved in cell cycle regulation, apoptosis and DNA damage. There are seven mismatch repair genes in humans, and 180 SNPs have been reported for the MSH3 gene. Loss of MSH3 protein expression is associated with colorectal cancer, and polymorphism rs26279G is associated with breast cancer risk.

FOXC1、フォークヘッドボックスC1は、胚発生中の中胚葉、脳および眼の発達に関与する転写因子であり、基底細胞様乳がんの重要な診断マーカーとなり得る。FOXC1のレベル上昇は、肺癌や肝細胞癌などのがんにおいて生存率が低いことを予測している。FOXC1タンパク質は、基底細胞において排他的に発現される。FOXC1は、Gli2転写因子の直接相互作用を介してヘッジホッグシグナル伝達のスムーズヘッド(SMO)非依存性活性化因子として同定されている。 FOXC1 and forkhead box C1 are transcription factors involved in the development of mesoderm, brain and eye during embryogenesis and can be important diagnostic markers for basal cell-like breast cancer. Elevated levels of FOXC1 predict low survival in cancers such as lung cancer and hepatocellular carcinoma. The FOXC1 protein is exclusively expressed in basal cells. FOXC1 has been identified as a smoothhead (SMO) -independent activator of hedgehog signaling transduction through direct interaction of Gli2 transcription factors.

これらの結果は、特定の遺伝子座の3Dクロマチン構造のレベルにおいてエピジェネティックな調節解除としてモニタリングされた、非常に強固で特異的なマーカーセットを示し、高度な信頼性を有する対照サンプルから乳がん患者サンプルを層別化するのを助けることができる。 These results show a highly robust and specific marker set monitored as epigenetic deregulation at the level of 3D chromatin structure at a particular locus, from highly reliable control samples to breast cancer patient samples. Can help stratify.

Figure 0007005596000032
Figure 0007005596000032

Figure 0007005596000033
Figure 0007005596000033

Figure 0007005596000034
Figure 0007005596000034

Figure 0007005596000035
Figure 0007005596000035

例3
この例に記載された研究は、ポリメラーゼ連鎖反応(PCR)およびqPCRによって型付けされた13個のネステッドマーカーに関する(下記の表19を参照)。これらのマーカーは、非悪性個体から乳がん患者を識別するために開発した。
Example 3
The studies described in this example relate to 13 nested markers typed by polymerase chain reaction (PCR) and qPCR (see Table 19 below). These markers were developed to identify breast cancer patients from non-malignant individuals.

Figure 0007005596000036
Figure 0007005596000036

qPCR開発の概要は次のとおりである:
-ネステッドPCRプライマー
-単一工程SYBR PCR(温度勾配最適化)
-ゲル精製
-蛍光光度計の測定、配列決定、相同性およびゲノムマッピングチェック
-加水分解プローブの最適化
-患者サンプルを用いた標準曲線試験。
The outline of qPCR development is as follows:
-Nested PCR Primer-Single step SYBR PCR (Temperature Gradient Optimization)
-Gel purification-Fluorometer measurement, sequencing, homology and genomic mapping checks-Optimization of hydrolysis probes-Standard curve test with patient samples.

この研究は、少量の血液サンプルを用いて非悪性物質から乳がん患者を識別するために使用できるエピジェネティックな変化を同定することであった。 This study was to identify epigenetic changes that could be used to identify breast cancer patients from non-malignant substances using small blood samples.

元の試験評価作業からの血液サンプルを含むアジア系コホートからの血液サンプルを、MIQE(定量的リアルタイムPCR実験の公表に必要な最小限の情報)ガイドラインに従ってqPCRプローブアッセイを検証するために使用した。 Blood samples from an Asian cohort, including blood samples from the original test evaluation work, were used to validate the qPCR probe assay according to the MQE (Minimum Information Required for Publication of Quantitative Real-Time PCR Experiments) guidelines.

各マーカーqPCRプローブおよび個々の検出アッセイを、品質検出のための以下のMIQE準拠基準を満たすために、サンプルの代表的なプール(4×4)上で温度勾配にわたって開発および試験した:
1.特異度:予測されたPCRアンプリコンを配列決定で検証した。
2.線形標準曲線(R>0.98)。
3.効率(E)、E>90%。
4.すべてのアッセイにゲノム非特異的交差反応対照を使用。
Each marker qPCR probe and individual detection assay was developed and tested over a temperature gradient on a representative pool of samples (4x4) to meet the following MQE compliance criteria for quality detection:
1. 1. Specificity: The predicted PCR amplicon was validated by sequencing.
2. 2. Linear standard curve (R 2 > 0.98).
3. 3. Efficiency (E), E> 90%.
4. Genome-nonspecific cross-reactivity controls were used for all assays.

要件は、ネステッドマーカーの少なくとも70%が、アッセイの性能が上記の4つの基準を満たす加水分解プローブを用いた検出のために開発されることであった。 The requirement was that at least 70% of nested markers were developed for detection using hydrolysis probes whose assay performance meets the above four criteria.

EpiSwitch(商標)qPCRアッセイ開発データ
CCSバイオマーカーをネステッドPCRによって確認した。すべての開発PCRはQIAgilityを使用して作製した。ウェル当たり10ngの3Cサンプル鋳型を、単一工程温度勾配PCRおよびSYBRに基づく検出を用いて、濃度が一致した陰性対照を用いてスクリーニングした。10種の相互作用を同定し、配列決定した。配列データをENSEMBLに提出し、予測された3C相互作用のそれぞれのゲノム位置をENSEMBL BlatおよびNeedleman-Wunschアルゴリズムを用いて確認した。加水分解プローブを、確認された各相互作用の接合領域に対して設計し、温度勾配によって最適化した。すべてのサンプルは、安定な独立した3C相互作用(MMP1)について陽性であった。すべてのアッセイは、患者サンプルn=8(4=乳がん、4=非悪性)、標準曲線および濃度一致陰性対照で試験した。
EpiSwitch ™ qPCR Assay Development Data CCS biomarkers were confirmed by nested PCR. All development PCRs were made using QIAguility. A 3C sample template of 10 ng per well was screened using a single-step temperature gradient PCR and SYBR-based detection using a concentration-matched negative control. Ten interactions were identified and sequenced. Sequence data was submitted to ENSEMBL and the genomic position of each predicted 3C interaction was confirmed using the ENSEMBL Blat and Needleman-Wunsch algorithms. Hydrolyzed probes were designed for the junction region of each confirmed interaction and optimized by temperature gradient. All samples were positive for a stable independent 3C interaction (MMP1). All assays were tested on patient sample n = 8 (4 = breast cancer, 4 = non-malignant), standard curve and concentration-matched negative controls.

元の配列決定電気泳動図を含む開発プロセスのプライマーデータを、各qPCRアッセイについて明白で簡単に確認できるフォーマットで提示する。アッセイはアルファベット順に行う。プローブの温度勾配最適化の間、10コピーの標準を陽性対照として用いた。患者サンプルを1~10コピーの間の曲線を用いて試験した。報告書に記載されている各アッセイについて、患者スクリーニング中の標準曲線の分析における任意の変化を記録する。 Primer data for the development process, including the original sequencing electrophoretogram, is presented in a clear and easily confirmable format for each qPCR assay. Assays are performed in alphabetical order. During the probe temperature gradient optimization, 106 copies of the standard were used as positive controls. Patient samples were tested using curves between 1 and 106 copies. For each assay described in the report, record any changes in the analysis of the standard curve during patient screening.

EpiSwitch(商標)qPCRアッセイの概要
ATM_11_108118137_108126372_108155279_108156687_RF
i.3Cの鋳型を単一工程で増幅した。
ii.ラボチップ画像。コメント:アンプリコンは、パラホルムアルデヒド固定サンプル(テンプレート10ng)でだけ見ることができる。単一工程PCR産物の予想サイズは472bpである。
iii.サンプルPCR産物の直接配列決定の後の、ENSEMBL BLAT(図1)。コメント:良質の配列決定(フォワードおよびリバースプライマー)は、予測される3C相互作用との100%の相同性を有する。
iv.定量的PCRアッセイ標準曲線の性能。標準曲線は10~10コピーから線形である。R=0.996。
v.1つのアンプリコンが倍増し、2つを生み出すことが効率100%である。アッセイの効率=91.7%(MIQEガイドラインは>90%)。
vi.このアッセイにより、患者(n=8)のサブセット(C01~C12=乳がん、D01~D12=非悪性)の間に大きなコピー数の差が示される(表20)。SQ=開始量、20ngの鋳型のコピー。NaN=0コピー。
EpiSwitch ™ qPCR Assay Overview ATM_11_108118137_108126372_108155527_10815687_RF
i. The 3C mold was amplified in a single step.
ii. Lab chip image. Comment: The amplicon can only be seen with a paraformaldehyde fixative sample (template 10 ng). The expected size of the single-step PCR product is 472 bp.
iii. After direct sequencing of the sample PCR product, ENSEMBL BLAT (Fig. 1). Comments: Good quality sequencing (forward and reverse primers) has 100% homology with the expected 3C interactions.
iv. Quantitative PCR Assay Standard Curve Performance. The standard curve is linear from 10 2 to 106 copies. R 2 = 0.996.
v. It is 100% efficient to double one amplicon and produce two. Assay efficiency = 91.7% (MIQE guideline> 90%).
vi. This assay shows a large copy count difference between a subset of patients (n = 8) (C01-C12 = breast cancer, D01-D12 = non-malignant) (Table 20). SQ = starting amount, copy of 20 ng mold. NaN = 0 copy.

サンプルPCR産物の直接配列決定の後のENSEMBL BLAT。
このPCR産物を配列決定し、染色体11q22.3にマッピングした。2つの3C断片をTaq I(TCGA)において連結する。配列トレースの上は、ENSEMBL BLATマッピングデータ(配列相同性は赤色)である。
ENSEMBL BLAT after direct sequencing of sample PCR products.
This PCR product was sequenced and mapped to chromosome 11q22.3. Two 3C fragments are linked at Taq I (TCGA). Above the sequence trace is the ENSEMBL BLAT mapping data (sequence homology is red).

Figure 0007005596000037
Figure 0007005596000037

CDC6_17_38421089_38423079_38451196_38457050_FF
i.3Cの鋳型を単一工程で増幅した。
ii.ラボチップ画像。コメント:バンドは、パラホルムアルデヒド固定サンプル(テンプレート10ng)でだけ見ることができる。単一工程PCR産物の予想サイズは428bpである。
iii.サンプルPCR産物の直接配列決定後の、ENSEMBL BLAT。コメント:良質の配列決定(フォワードおよびリバースプライマー)は、予測される3C相互作用との100%の相同性を有する。
iv.定量的PCRアッセイ標準曲線の性能。標準曲線は10~10コピーから線形である。R=0.99。
v.1つのアンプリコンが倍増し、2つを生み出すことが効率100%である。効率90.7%(MIQEガイドラインは>90%)。
vi.このアッセイにより、患者(n=8)のサブセット(C01~C12=乳がん、D01~D12=非悪性)の間に大きなコピー数の差が示される(表2)。SQ=開始量、20ngの鋳型のコピー。NaN=0コピー。
CDC6_17_3841089_38423079_38451196_38457050_FF
i. The 3C mold was amplified in a single step.
ii. Lab chip image. Comment: The band can only be seen with a paraformaldehyde fixative sample (template 10 ng). The expected size of the single-step PCR product is 428 bp.
iii. ENSEMBL BLAT after direct sequencing of the sample PCR product. Comments: Good quality sequencing (forward and reverse primers) has 100% homology with the expected 3C interactions.
iv. Quantitative PCR Assay Standard Curve Performance. The standard curve is linear from 10 1 to 106 copies. R 2 = 0.99.
v. It is 100% efficient to double one amplicon and produce two. Efficiency 90.7% (MIQE guideline> 90%).
vi. This assay shows a large copy count difference between a subset of patients (n = 8) (C01-C12 = breast cancer, D01-D12 = non-malignant) (Table 2). SQ = starting amount, copy of 20 ng mold. NaN = 0 copy.

Figure 0007005596000038
Figure 0007005596000038

FOXC1_6_1577253_1581989_1604206_1605973_FR。
i.3Cの鋳型を単一工程で増幅した。
ii.ラボチップ画像。コメント:バンドは、パラホルムアルデヒド固定サンプル(テンプレート10ng)でだけ見ることができる。単一工程PCR産物の予想サイズは208bpである。
iii.サンプルPCR産物の直接配列決定後の、ENSEMBL BLAT。コメント:良質の配列決定(フォワードおよびリバースプライマー)は、予測される3C相互作用との100%の相同性を有する。
iv.定量的PCRアッセイ標準曲線の性能。標準曲線は10~10コピーから線形である。R=0.992。
v.1つのアンプリコンが倍増し、2つを生み出すことが効率100%である。このアッセイの効率は101.6%であった(MIQEガイドラインは>90%)。
vi.このアッセイにより、患者(n=8)のサブセット(C01~C12=乳がん、D01~D12=非悪性)の間に大きなコピー数の差が示される(表21)。SQ=開始量、20ngの鋳型のコピー。NaN=0コピー。
FOXC1_6_1577253_1581989_1604206_1605973_FR.
i. The 3C mold was amplified in a single step.
ii. Lab chip image. Comment: The band can only be seen with a paraformaldehyde fixative sample (template 10 ng). The expected size of a single-step PCR product is 208 bp.
iii. ENSEMBL BLAT after direct sequencing of the sample PCR product. Comments: Good quality sequencing (forward and reverse primers) has 100% homology with the expected 3C interactions.
iv. Quantitative PCR Assay Standard Curve Performance. The standard curve is linear from 10 1 to 106 copies. R 2 = 0.992.
v. It is 100% efficient to double one amplicon and produce two. The efficiency of this assay was 101.6% (MIQE guideline> 90%).
vi. This assay shows a large copy count difference between a subset of patients (n = 8) (C01-C12 = breast cancer, D01-D12 = non-malignant) (Table 21). SQ = starting amount, copy of 20 ng mold. NaN = 0 copy.

サンプルPCR産物の直接配列決定の後のENSEMBL BLAT。
FOXC1 ウェルB7 208bpの単一工程増幅(内部プライマー)のラボチップ画像。このPCR産物を配列決定し、染色体6pにマッピングした。
ENSEMBL BLAT after direct sequencing of sample PCR products.
Lab chip image of single-step amplification (internal primer) of FOXC1 well B7 208bp. This PCR product was sequenced and mapped to chromosome 6p.

Figure 0007005596000039
Figure 0007005596000039

MAP3K1_5_56102259_56110500_56140227_56144076_FF
i.3Cの鋳型を単一工程で増幅した。
ii.ラボチップ画像。コメント:アンプリコンは、パラホルムアルデヒド固定サンプル(テンプレート10ng)でだけ見ることができる。単一工程PCR産物の予想サイズは495bpである。
iii.サンプルPCR産物の直接配列決定後の、ENSEMBL BLAT。コメント:良質の配列決定(フォワードおよびリバースプライマー)は、予測される3C相互作用との100%の相同性を有する。
iv.定量的PCRアッセイ標準曲線の性能。標準曲線は10~10コピーから線形である。R=0.999。
v.1つのアンプリコンが倍増し、2つを生み出すことが効率100%である。アッセイの効率=91.9%(MIQEガイドラインは>90%)。
vi.患者(n=8)のサブセット(C01~C12=乳がん、D01~D12=非悪性)の間のコピー数の差(表22)。SQ=開始量、20ngの鋳型のコピー。NaN=0コピー。
MAP3K1_5_56102259_56110500_56140227_56144076_FF
i. The 3C mold was amplified in a single step.
ii. Lab chip image. Comment: The amplicon can only be seen with a paraformaldehyde fixative sample (template 10 ng). The expected size of a single-step PCR product is 495 bp.
iii. ENSEMBL BLAT after direct sequencing of the sample PCR product. Comments: Good quality sequencing (forward and reverse primers) has 100% homology with the expected 3C interactions.
iv. Quantitative PCR Assay Standard Curve Performance. The standard curve is linear from 10 2 to 106 copies. R 2 = 0.999.
v. It is 100% efficient to double one amplicon and produce two. Assay efficiency = 91.9% (MIQE guideline> 90%).
vi. Difference in copy count between a subset of patients (n = 8) (C01-C12 = breast cancer, D01-D12 = non-malignant) (Table 22). SQ = starting amount, copy of 20 ng mold. NaN = 0 copy.

サンプルPCR産物の直接配列決定の後のENSEMBL BLAT。
このPCR産物を配列決定し、染色体5q11.2にマッピングした。
ENSEMBL BLAT after direct sequencing of sample PCR products.
This PCR product was sequenced and mapped to chromosome 5q11.2.

Figure 0007005596000040
Figure 0007005596000040

ME3_11_86300063_86304401_86420537_86426200_FR
i.3Cの鋳型を単一工程で増幅した。
ii.ラボチップ画像。コメント:アンプリコンは、パラホルムアルデヒド固定サンプル(テンプレート10ng)でだけ見ることができる。単一工程PCR産物の予想サイズは291bpである。
iii.サンプルPCR産物の直接配列決定後の、ENSEMBL BLAT。コメント:良質の配列決定(フォワードおよびリバースプライマー)は、予測される3C相互作用との100%の相同性を有する。
iv.定量的PCRアッセイ標準曲線の性能。標準曲線は10~10コピーから線形である。R=0.998。
v.1つのアンプリコンが倍増し、2つを生み出すことが効率100%である。アッセイの効率=96.8%(MIQEガイドラインは>90%)。
vi.患者(n=8)サブセット(C01~C12=乳がん、D01~D12=非悪性)間のアッセイの差異(表5)。SQ=開始量、20ngの鋳型のコピー。NaN=0コピー。
ME3_11_86300063_863304401_86420537_86426200_FR
i. The 3C mold was amplified in a single step.
ii. Lab chip image. Comment: The amplicon can only be seen with a paraformaldehyde fixative sample (template 10 ng). The expected size of the single-step PCR product is 291 bp.
iii. ENSEMBL BLAT after direct sequencing of the sample PCR product. Comments: Good quality sequencing (forward and reverse primers) has 100% homology with the expected 3C interactions.
iv. Quantitative PCR Assay Standard Curve Performance. The standard curve is linear from 10 2 to 106 copies. R 2 = 0.998.
v. It is 100% efficient to double one amplicon and produce two. Assay efficiency = 96.8% (MIQE guideline> 90%).
vi. Assay differences between patient (n = 8) subsets (C01-C12 = breast cancer, D01-D12 = non-malignant) (Table 5). SQ = starting amount, copy of 20 ng mold. NaN = 0 copy.

Figure 0007005596000041
Figure 0007005596000041

MELK_9_36577630_36579243_36637050_36643005_RF
i.3Cの鋳型を単一工程で増幅した。
ii.ラボチップ画像。コメント:アンプリコンは、パラホルムアルデヒド固定サンプル(テンプレート10ng)でだけ見ることができる。単一工程PCR産物の予想サイズは265bpである。
iii.サンプルPCR産物の直接配列決定後の、ENSEMBL BLAT。コメント:良質の配列決定(フォワードおよびリバースプライマー)は、予測される3C相互作用との100%の相同性を有する。
iv.定量的PCRアッセイ標準曲線の性能。標準曲線は10~10コピーから線形である。R=0.995。
v.1つのアンプリコンが倍増し、2つを生み出すことが効率100%である。アッセイの効率=91.3%(MIQEガイドラインは>90%)。
vi.患者(n=8)サブセット(C01~C12=乳がん、D01~D12=非悪性)間のアッセイの差異(表24)。SQ=開始量、20ngの鋳型のコピー。NaN=0コピー。
MELK_9_36577630_36579243_36637050_36643005_RF
i. The 3C mold was amplified in a single step.
ii. Lab chip image. Comment: The amplicon can only be seen with a paraformaldehyde fixative sample (template 10 ng). The expected size of a single-step PCR product is 265 bp.
iii. ENSEMBL BLAT after direct sequencing of the sample PCR product. Comments: Good quality sequencing (forward and reverse primers) has 100% homology with the expected 3C interactions.
iv. Quantitative PCR Assay Standard Curve Performance. The standard curve is linear from 10 2 to 106 copies. R 2 = 0.995.
v. It is 100% efficient to double one amplicon and produce two. Assay efficiency = 91.3% (MIQE guideline> 90%).
vi. Assay differences between patient (n = 8) subsets (C01-C12 = breast cancer, D01-D12 = non-malignant) (Table 24). SQ = starting amount, copy of 20 ng mold. NaN = 0 copy.

サンプルPCR産物の直接配列決定の後のENSEMBL BLAT。
このPCR産物を配列決定し、染色体9p13.2にマッピングした。
ENSEMBL BLAT after direct sequencing of sample PCR products.
This PCR product was sequenced and mapped to chromosome 9p13.2.

Figure 0007005596000042
Figure 0007005596000042

MSH3_5_80021913_80025030_80153948_80159012_RF
i.3Cの鋳型を単一工程で増幅した。
ii.ラボチップ画像。コメント:アンプリコンは、パラホルムアルデヒド固定サンプル(テンプレート10ng)でだけ見ることができる。単一工程PCR産物の予想サイズは207bpである。
iii.サンプルPCR産物の直接配列決定後の、ENSEMBL BLAT。コメント:良質の配列決定(フォワードおよびリバースプライマー)は、予測される3C相互作用との100%の相同性を有する。
iv.定量的PCRアッセイ標準曲線の性能。標準曲線は10~10コピーから線形である。R=0.99。
v.1つのアンプリコンが倍増し、2つを生み出すことが効率100%である。アッセイの効率=97.1%(MIQEガイドラインは>90%)。
vi.患者(n=8)サブセット(C01~C12=乳がん、D01~D12=非悪性)間のアッセイの差異(表25)。SQ=開始量、20ngの鋳型のコピー。NaN=0コピー。
MSH3_5_80021913_80025030_80153948_80159012_RF
i. The 3C mold was amplified in a single step.
ii. Lab chip image. Comment: The amplicon can only be seen with a paraformaldehyde fixative sample (template 10 ng). The expected size of the single-step PCR product is 207 bp.
iii. ENSEMBL BLAT after direct sequencing of the sample PCR product. Comments: Good quality sequencing (forward and reverse primers) has 100% homology with the expected 3C interactions.
iv. Quantitative PCR Assay Standard Curve Performance. The standard curve is linear from 10 2 to 106 copies. R 2 = 0.99.
v. It is 100% efficient to double one amplicon and produce two. Assay efficiency = 97.1% (MIQE guideline> 90%).
vi. Assay differences between patient (n = 8) subsets (C01-C12 = breast cancer, D01-D12 = non-malignant) (Table 25). SQ = starting amount, copy of 20 ng mold. NaN = 0 copy.

サンプルPCR産物の直接配列決定の後のENSEMBL BLAT。
このPCR産物を配列決定し、染色体5q14.1にマッピングした。
ENSEMBL BLAT after direct sequencing of sample PCR products.
This PCR product was sequenced and mapped to chromosome 5q14.1.

Figure 0007005596000043
Figure 0007005596000043

NF1_17_29477103_29483764_29651799_29657368_FF
i.3Cの鋳型を単一工程で増幅した。
ii.ラボチップ画像。コメント:期待されるサイズのアンプリコンは、パラホルムアルデヒド固定サンプル(テンプレート10ng)でだけ見ることができる。単一工程PCR産物の予想サイズは401bpである。
iii.サンプルPCR産物の直接配列決定後の、ENSEMBL BLAT。コメント:良質の配列決定(フォワードおよびリバースプライマー)は、予測される3C相互作用との100%の相同性を有する。
iv.定量的PCRアッセイ標準曲線の性能。標準曲線は10~10コピーから線形である。R=0.987。
v.1つのアンプリコンが倍増し、2つを生み出すことが効率100%である。アッセイの効率=99%(MIQEガイドラインは>90%)。
vi.このアッセイにより、患者(n=8)サブセット(C01~C12=乳がん、D01~D12=非悪性)間の差異(表26)が示される。SQ=開始量、20ngの鋳型のコピー。NaN=0コピー。
NF1_17_29477103_294837664_29651799_29657368_FF
i. The 3C mold was amplified in a single step.
ii. Lab chip image. Comment: Expected size amplicon can only be seen with paraformaldehyde fixative sample (template 10 ng). The expected size of a single-step PCR product is 401 bp.
iii. ENSEMBL BLAT after direct sequencing of the sample PCR product. Comments: Good quality sequencing (forward and reverse primers) has 100% homology with the expected 3C interactions.
iv. Quantitative PCR Assay Standard Curve Performance. The standard curve is linear from 10 2 to 106 copies. R 2 = 0.987.
v. It is 100% efficient to double one amplicon and produce two. Assay efficiency = 99% (MIQE guideline> 90%).
vi. This assay shows differences (Table 26) between patient (n = 8) subsets (C01-C12 = breast cancer, D01-D12 = non-malignant). SQ = starting amount, copy of 20 ng mold. NaN = 0 copy.

Figure 0007005596000044
Figure 0007005596000044

SRD5A1_5_6634973_6639025_6667775_6669711_RF
i.3Cの鋳型を単一工程で増幅した。
ii.ラボチップ画像。コメント:アンプリコンは、パラホルムアルデヒド固定サンプル(テンプレート10ng)でだけ見ることができる。単一工程PCR産物の予想サイズは219bpである。
iii.サンプルPCR産物の直接配列決定後の、ENSEMBL BLAT。コメント:良質の配列決定(フォワードおよびリバースプライマー)は、予測される3C相互作用との100%の相同性を有する。
iv.定量的PCRアッセイ標準曲線の性能。標準曲線は10~10コピーから線形である。R=0.997。
v.1つのアンプリコンが倍増し、2つを生み出すことが効率100%である。アッセイの効率=95.5%(MIQEガイドラインは>90%)。
SRD5A1_5_6634973_6639025_66677775_6669711_RF
i. The 3C mold was amplified in a single step.
ii. Lab chip image. Comment: The amplicon can only be seen with a paraformaldehyde fixative sample (template 10 ng). The expected size of the single-step PCR product is 219 bp.
iii. ENSEMBL BLAT after direct sequencing of the sample PCR product. Comments: Good quality sequencing (forward and reverse primers) has 100% homology with the expected 3C interactions.
iv. Quantitative PCR Assay Standard Curve Performance. The standard curve is linear from 10 2 to 106 copies. R 2 = 0.997.
v. It is 100% efficient to double one amplicon and produce two. Assay efficiency = 95.5% (MIQE guideline> 90%).

TSPYL5_8_98276431_98282736_98316421_98318720_FF
i.3Cの鋳型を単一工程で増幅した。
ii.ラボチップ画像。コメント:アンプリコンは、パラホルムアルデヒド固定サンプル(テンプレート10ng)でだけ見ることができる。単一工程PCR産物の予想サイズは507bpである。
iii.サンプルPCR産物の直接配列決定後の、ENSEMBL BLAT。コメント:良質の配列決定(フォワードおよびリバースプライマー)は、予測される3C相互作用との100%の相同性を有する。
iv.定量的PCRアッセイ標準曲線の性能。標準曲線は10~10コピーから線形である。R=0.998。
v.1つのアンプリコンが倍増し、2つを生み出すことが効率100%である。アッセイの効率=94.2%(MIQEガイドラインは>90%)。
TSPYL5_8_98276431_98282736_98316421_98318720_FF
i. The 3C mold was amplified in a single step.
ii. Lab chip image. Comment: The amplicon can only be seen with a paraformaldehyde fixative sample (template 10 ng). The expected size of a single-step PCR product is 507 bp.
iii. ENSEMBL BLAT after direct sequencing of the sample PCR product. Comments: Good quality sequencing (forward and reverse primers) has 100% homology with the expected 3C interactions.
iv. Quantitative PCR Assay Standard Curve Performance. The standard curve is linear from 10 2 to 106 copies. R 2 = 0.998.
v. It is 100% efficient to double one amplicon and produce two. Assay efficiency = 94.2% (MIQE guideline> 90%).

結論:
1.3CマーカーATM、FOXC1およびTSPYL1により、両方のプライマーセットについての単一工程産物が生成された。
2.ATMコピー数は乳がんにおいて増加する(n=4、表1)。C行(悪性末期疾患乳がん)のサンプルは、p-値0.009037772でD行(非悪性早期)とは異なる。
3.CDC6_FFのコピー数は乳がんにおいて減少する(n=4、表2)。
4.FOXC1_FRのコピー数は乳がんにおいて減少する。行Cは、行Dと異なり、p値が0.004112668である。
Conclusion:
1.3C markers ATM, FOXC1 and TSPYL1 produced a single step product for both primer sets.
2. 2. ATM copy numbers increase in breast cancer (n = 4, Table 1). The sample in row C (malignant end-stage breast cancer) is different from row D (non-malignant early stage) with a p-value of 0.009037772.
3. 3. The number of copies of CDC6_FF is reduced in breast cancer (n = 4, Table 2).
4. The number of copies of FOXC1_FR is reduced in breast cancer. Row C, unlike row D, has a p-value of 0.0041112668.

Figure 0007005596000045
Figure 0007005596000045

>ATM_11_108118137_108126372_108155279_108156687_RF
下線=フォワード、二重下線=リバース、点線下線=Taq I。
AAGGGATAAGTAACCAAACTTGGTCAATATTAGATAAACTTCAAGGGACCTTTTTTTTTTTTAGTTTCCTAGTTATCTATATTGAACCAAGAAATGGAACAGCAAGTTCCTTAGTTGCTTAGGTGGACCTATTCAGAACTGGTTGTAAGTCTGCAGTCTGAAGGGAAATGGTGAGCAGAGGACTCCTTTCCCAAAGACAGCTGGAACAGAAATAGGCACTCCAGAGGTTATGGAATTTGAGAGAGATACTCAGCCTCTAGCCACTCCCATTCAATCTCCCAGCTTAGTCTTCTGAGCATTCTTAATCTTACTATTCTTTTCTTAATGTATTCAAACCAAAAGACAGCAATTTTTAGAGCCTGAATAGGTTTTGGAGGGAAAAGTAATTACGTTCAACTTCGACTGTATTCTACAAAGTGCTGGGATTACAGGCATGAGCCACCAAGCCCAGTCTGTTTCTTTTTTGCAATTAAGCTAGAGTTCACATAGCATAAAATTCACGATTTTGAGTTGTACATTTCAGTGGTTTTTAGTATTTTTACTATGTTGTACAACCATCATCACTAATTCTGGAAACTTTTTTTATTTTATTTTTATTTTTTTGAGATGGAGTCTTGCTCTGTCACCCAGGCTGGAGTGCAGTGGCACAATCTCCGCTCACTGCAACCTCCCTTTCCCGGGTTCAAGTGATTCTCCTGCATCAGCCTCCCGAGTAGCTGGGACTACAGGTGCCTGCCACCACGCCCAGCTAATTTTTGTTTTTTTAGTAGAGACTGGGTTTCACCATATTGGCCAGCCTA
> ATM_11_108118137_108126372_108155527_10815687_RF
Underline = forward, double underline = reverse, dotted underline = Taq I.
AAGGGATAAGTAACCAAACTTGGTCAATATTAGATAAACTTCAAGGGACCTTTTTTTTTTTTAGTTTCCTAGTTATCTATATTGAACCAAGAAATGGAACA GCAAGTTCCTTAGTTGCTTAG GTGGACCTATTCAGAACTGGTTGTAAGTCTGCAGTCTGAAGGGAAATGGTGAGCAGAGGACTCCTTTCCCAAAGACAGCTGGAACAGAAATAGGCAC TCCAGAGGTTATGGAATTTGAG AGAGATACTCAGCCTCTAGCCACTCCCATTCAATCTCCCAGCTTAGTCTTCTGAGCATTCTTAATCTTACTATTCTTTTCTTAATGTATTCAAACCAAAAGACAGCAATTTTTAGAGCCTGAATAGGTTTTGGAGGGAAAAGTAATTACGTTCAACTTCGACTGTATTCTACAAAGTGCTGGGATTACAGGCATGAGCCACCAAGCCCAGTCTGTTTCTTTTTTGCAATTAAGCTAGAGTTCACATAGCATAAAATTCACGATTTTGAGTTGTACATTTCAGTGGTTTTTAGTATTTTTACTATGTTGTACAACCATCATCACTAATTCTGGAAACTTTTTTTATTTTATTTTTATTTTTTTGAGATGGAGTCTTGCTCTGTCACCCAGGCTGGAGTGCAGTGGCACAATCTCCGCTCACTGCAACCTCCCTTTCCCGGGTTCAAGTGATTCTCCTGCATCAGCCTCCCGAGTAGCTGGGACTACAGGTGCCTGCCACCACGCCCAGCTAATTTTTGTTTTTTTAGTAGAGACTGGGTTTCACCATATTGGCCAGCCTA

Figure 0007005596000046
Figure 0007005596000046

>CDC6_17_38421089_38423079_38451196_38457050_FF
AGGTAAGTTAAAGACCAAGAACTGGCATTGGTCTTAGTATCATGGGACCCTTTTGAGTAGTTTCAGTGGAGTGGTGGAGGGTGAAAGTGAAAGCTTAATTGGAGTGGGTTCAAGAATGCAGGAATAGGAGGAGAGAAATTGGAGATAGCAATATAGAAATCTCTTAAAGAGTTCGCTGTAAAGTCCAGGAGAGAGGGGTGAAGATAAGTGAAGTGATTGTTGGACGAAGATGTGGGGTTGAGAGTTGTTTTTTTCCCATCCCAAGATGGGAGACCTATTTGTATGCTGATGGAATGAGTAGCATGAAACTTAGGAGAGAGGGAAAAAATTGAATCAGAAGAGAGGGAACAGATTGCCTGAATAATGACCTGGAGGAGGCCAGAGAAAAGAGAATGTGATCGATTTCTAAAATACTGTGTGTGTGTATGTATGATGAGACAGATGATACTAAGTTTGAGCTAAAGGAAATTCAAGTATAGTCACATGGTGGCAAAGCAGAGGTTTTAAATCTCTAACCAGAGGCCAAAGGATGAGAGATAATGCTATTCTCTTAAGGATGTCAAAATAATGTGGGATGACTTGAAAAGTAGGGTTACCCTTTCTCTGGGCCAAATAGTGAGCTGTTTTGTCCTATGGAATGTAATTTAATGTCAGAGGAACAAAACCCACCTCATGAAAGGACCAGAGAACTACTGTATTTTTTTTTGGGACAGGATCTCTGTCACTCAGGCTGGAGTACAGTGGCACTATCATGGCTCACTGCAGCCTTGGCTTCCTGGGTTCAAGTGATCCTCCTGCCT
> CDC6_17_3841089_38423079_38451196_38457050_FF
AGGTAAGTTAAAGACCAAGAACTGGCATTGGTCTTAGTATCATGGGACCCTTTTGAGTAGTTTCAGTGGAGTGGTGGAGGGTGAAAGTGAAAGCTTAATTGGAGT GGGTTCAAGAATGCAGGAATAG GAGGAGAGAAATTGGAGATAGCAATATAGAAATCTCTTAAAGAGTTCGCTGTAAAGTCCAGGAGAGAGGGGTGAAGATAAGTGAAGTGATTGTTGGACGAAGATGTGGGGTTGAGAGTTGTTTTTTTCCCATCCCAAGATGGGAGACCTATTTGTATGCTGATGGAATGAGTA GCATGAAACTTAGGAGAGAGG GAAAAAATTGAATCAGAAGAGAGGGAACAGATTGCCTGAATAATGACCTGGAGGAGGCCAGAGAAAAGAGAATGTGATCGATTTCTAAAATACTGTGTGTGTGTATGTATGATGAGACAGATGATACTAAGTTTGAGCTAAAGGAAATTCAAGTATAGTCACATGGTGGCAAAGCAGAGGTTTTAAATCTCTAACCAGAGGCCAAAGGATGAGAGATAATGCTATTCTCTTAAGGATGTCAAAATAATGTGGGATGACTTGAAAAGTAGGGTTACCCTTTCTCTGGGCCAAATAGTGAGCTGTTTTGTCCTATGGAATGTAATTTAATGTCAGAGGAACAAAACCCACCTCATGAAAGGACCAGAGAACTACTGTATTTTTTTTTGGGACAGGATCTCTGTCACTCAGGCTGGAGTACAGTGGCACTATCATGGCTCACTGCAGCCTTGGCTTCCTGGGTTCAAGTGATCCTCCTGCCT

Figure 0007005596000047
Figure 0007005596000047

>FOXC1_6_1577253_1581989_1604206_1605973_FR
CGCCGTCCCAGCAGCGCCCCATCTCACCAACTCCCACCTTCATGTGTGGCCGCCCACCTAGAGCCATGCCTGAAGCCACTGTCCCTGACCACAAAGCTTTTGGCTGATAGGAAGCATGACAGCACTGGGGCCCTACACTGGAAGCGGGACCGTCCAGAGAAGAAGACTGCGCACAGGGATCGGGAGCTGGGACACACGTTAGTCAAGGTGTACGAGGGAGGAATCACCGCCATGTGGAGCCACTACTCGGGGAGGACGTGGGCCACCCGGAGCTCAGTGACAGTACTCCCGGGAGTGTACATCGTTGGTAATGTCCACGACAGTGTCCCTGCCTGTGACCCAATAATTTCCCATCCAGGGACACACTTCACAGAAATGCACGCACAGGCACAACAGCATCGAAACCGGTTCTTTGGAGGCTCAGTTTTTGGTAATTAAGACTAAGGAGTGTTTAAAAAACAGAAGTACATTTTCCTGGAAACCAGCAGTCTTTATTTGCAACTTTTATTGGCAAACCTGGCTGCCAGTAAATACATTCCTTGGCATCTCCCACAATGTAATTCACTGGATGGAGCGGCCTTGCTTTTTCTGTAACGTGTACGTCAATTAAAAGGGCCGCCTGGAAGGAATGCGTAGCGGTGGCTGAAAGCCCCAGTCTCGGGTCACCTCCCTCCACTCCAGGAACAAAAGCGTCCGTGGTCTGTGCCTGGAAGTCTGAGAGGGTCTCCCCGATGGGGCTGTTCCCGCCCGGACCCTGAGGGATGAGAGTTGCAGCCTAGAAAACCAGGTGCCAGGCCCTG
> FOXC1_6_1577253_1581989_1604206_1605973_FR
CGCCGTCCCAGCAGCGCCCCATCTCACCAACTCCCACCTTCATGTGTGGCCGCCCACCTAGAGCCATGCCTGAAGCCACTGTCCCTGACCACAAAGCTTTTGGCTGATAGGAAGCATGACAGCACTGGGGCCCTACACTGGAAGCGGGACCGTCCAGAGAAGAAGACTGCGCACAGGGATCGGGAGCT GGGACACACGTTAGTCAAG GTGTACGAGGGAGGAATCACCGCCATGTGGAGCCACTACTCGGGGAGGACGTGGGCCACCCGGAGCTCAGTGACAGTACTCCCG GGAGTGTACATCGTTGGTAATG TCCACGACAGTGTCCCTGCCTGTGACCCAATAATTTCCCATCCAGGGACACACTTCACAGAAATGCACGCACAGGCACAACAGCATCGAAACCGGTTCTTTGGAGGCTCAGTTTTTGGTAATTAAGACTAAGGAGTGTTTAAAAAACAGAAGTACATTTTCCTGGAAACCAGCAGTCTTTATTTGCAACTTTTATTGGCAAACCTGGCTGCCAGTAAATACATTCCTTGGCATCTCCCACAATGTAATTCACTGGATGGAGCGGCCTTGCTTTTTCTGTAACGTGTACGTCAATTAAAAGGGCCGCCTGGAAGGAATGCGTAGCGGTGGCTGAAAGCCCCAGTCTCGGGTCACCTCCCTCCACTCCAGGAACAAAAGCGTCCGTGGTCTGTGCCTGGAAGTCTGAGAGGGTCTCCCCGATGGGGCTGTTCCCGCCCGGACCCTGAGGGATGAGAGTTGCAGCCTAGAAAACCAGGTGCCAGGCCCTG

Figure 0007005596000048
Figure 0007005596000048

>MAP3K1_5_56102259_56110500_56140227_56144076_FF
AAACCAGCTGGAGGAAAGGAAAGGAAGGAAGAAATAAACGCAACACAGAAGTTCTCCTCAGTTGACAAAAGGTCAAAAATCATTAACGTGTAAATGTTGCTTTTTCCATCCCAAAGCACCTTCTCACGTAGAGTCCAGGGACTAGGAGGACTCACAACGCAGCGATGGGCAGCCAGGCCCTGCAGGAGTGGGGACAGAGGGAACCCGGCCGGTGGCCCGACCCTGCAGGGAAGAAGGACGTGCGGCGAGAAGCATCGGATTCGGGGAGGGCCGGGACCTGGCCGAGGGTGACATTACCGAGCACTTCCTGGCACAGCGCTGGTCCCCTCCCCAAACGCGCTATATGTGGTTCTGTACGGGACTGCCTTTCCCAAAGACAGCCAAGGAAAAACTAAAGATCGAAAGTTTTTATTACTTCCAAATTAGTAAATTTGTAACAATCATCAGGCAACTAACTATAATAAGAGGGAATTTACAAAAGACAGAGAGCTACTAGTCAGTATCAAATCATTCTTAAAAGTGGCAACTCTGTATCAATTTTTTTTTTGCAGTCAATTACCTTTGACTCAGTCTATAAAGTACATGCCCAAATCTCCCTTTAGAGAAGAAAAGTGAATCAAAAAGAAAAATGTATATTAACTGTACAGTTCTCCTATACTAAATGTTCTTACATGCTCAAAATGTATGAATATATTTAAAGCAACTGATCCTCTATTGAATACTGAATAAACTTGAAGGGATTTCTAAGTAAATTATTACTGGTAACTCAAACTCAGTGTGCTATAAATTTCAGACACCAC
> MAP3K1_5_56102259_56110500_56140227_56144076_FF
AAACCAGCTGGAGGAAAGGAAAGGAAGGAAGAAATAAACGCAACACAGAAGTTCTCCTCAGTTGACAAAAGGTCAAAAATCATTAACGTGTAAATGTTGCTTTTTCCATCCCAAAGCACCTTCTCACGTAGAGTCCAGGGACTAGGAGGACTCACAACGCAGCGATGGGCAGCCAGGCCCTGCAGGAGTGGGGACAGAGGGAACCCGGCCGGTGGCCCGACCCTGCAGGGAAGAAGGACGTGCGGCGAGAAGCATCGGATTCGGGGAGGGCCGGGACCTGGCCGAGG GTGACATTACCGAGCACTTC CTGGCACAGCGCTGGTCCCCTCCCCAAACG CGCTATATGTGGTTCTGTACG GGACTGCCTTTCCCAAAGACAGCCAAGGAAAAACTAAAGATCGAAAGTTTTTATTACTTCCAAATTAGTAAATTTGTAACAATCATCAGGCAACTAACTATAATAAGAGGGAATTTACAAAAGACAGAGAGCTACTAGTCAGTATCAAATCATTCTTAAAAGTGGCAACTCTGTATCAATTTTTTTTTTGCAGTCAATTACCTTTGACTCAGTCTATAAAGTACATGCCCAAATCTCCCTTTAGAGAAGAAAAGTGAATCAAAAAGAAAAATGTATATTAACTGTACAGTTCTCCTATACTAAATGTTCTTACATGCTCAAAATGTATGAATATATTTAAAGCAACTGATCCTCTATTGAATACTGAATAAACTTGAAGGGATTTCTAAGTAAATTATTACTGGTAACTCAAACTCAGTGTGCTATAAATTTCAGACACCAC

Figure 0007005596000049
Figure 0007005596000049

>ME3_11_86300063_86304401_86420537_86426200_FR
TAACCTTCCATAGGCCTCAGCTCCCTTATCTATTAACCTGGTGAAATGCAGACCCCTCTGCATGGGGTTACAAGGTTTCAGCATGACTGGGTATGAAAAGAGAACAAAGAAGCTTCCTGGAGATGACTGTGGCCTTGGCTCACTGCCAGGAAAATGACTCATTTCTGTATGCCAGGGTTATAGTTCACTGTTACCCTGACAAATGAATGTGGAAGACCCATGATTTCCTCCACCCTCCTTCACTCACATAGTAAAAGTTAGCTACTGCCTGCAACATACCAGGCACCGTACAACACGAAACTGTAGGCTCCCCCTCCAGGAAGTGACAATGTCATTCCTAACCTGTTGGAATTTTAACACCTGTCATAAAAGGATCTCATGATGCTTTGAATACTTTCTCGATACCTTATTATAAAATCAGCTTTGTGTTGAATGATTTTTCCCAGCTGTAGACTAATGTAAATGTTCTGAGCATGTTTAAGGTAGGCTAGTCTAAGCTGTGATGTTAGGTAGATTAGGTGCATTTAAATGCATTTTCAATGATATTTTAAATTTGCAGTGGGTTTATCAGGATGTTACTCCAAGATGCTCCTCCAAGGTGAGGGGCATCTGTGTTTTAGTCAGTGAAAATGTCTTGCAAAACTGAAGATAAAATAAATACAGTTAGTCACACTTCACTTGCACTATAAGAAATTCTAAAGAAAAATTCTTCAAATTGAAGGAATATAATAACATAAATTTATATCTACAGGAAGGAATAAAGAGCAAAGAAATGATAAACAAATCGCTTAAAGTGTTTA
> ME3_11_86300063_86304401_86420537_86426200_FR
TAACCTTCCATAGGCCTCAGCTCCCTTATCTATTAACCTGGTGAAATGCAGACCCCTCTGCATGGGGTTACAAGGTTTCAGCATGACTGGGTATGAAAAGAGAACAAAGAAGCTTCCTGGAGATGACTGTGGCCTTGGCTCACTGCCAGGAAAATGACTCATTT CTGTATGCCAGGGTTATAGTTC ACTGTTACCCTGACAAATGAATGTGGAAGACCCATGATTTCCTCC ACCCTCCTTCACTCACATAG TAAAAGTTAGCTACTGCCTGCAACATACCAGGCACCGTACAACACGAAACTGTAGGCTCCCCCTCCAGGAAGTGACAATGTCATTCCTAACCTGTTGGAATTTTAACACCTGTCATAAAAGGATCTCATGATGCTTTGAATACTTTCTCGATACCTTATTATAAAATCAGCTTTGTGTTGAATGATTTTTCCCAGCTGTAGACTAATGTAAATGTTCTGAGCATGTTTAAGGTAGGCTAGTCTAAGCTGTGATGTTAGGTAGATTAGGTGCATTTAAATGCATTTTCAATGATATTTTAAATTTGCAGTGGGTTTATCAGGATGTTACTCCAAGATGCTCCTCCAAGGTGAGGGGCATCTGTGTTTTAGTCAGTGAAAATGTCTTGCAAAACTGAAGATAAAATAAATACAGTTAGTCACACTTCACTTGCACTATAAGAAATTCTAAAGAAAAATTCTTCAAATTGAAGGAATATAATAACATAAATTTATATCTACAGGAAGGAATAAAGAGCAAAGAAATGATAAACAAATCGCTTAAAGTGTTTA

Figure 0007005596000050
Figure 0007005596000050

MELK_9_36577630_36579243_36637050_36643005_RF
AGTAGAGATGGGGTTTCACCATGCTGGCCAGGCCAGTCTCAAACTCCTGACCTCAGGTGATCTGCCCGCCCCAGCCTCCCAAAATGCTAGAATTACAGGTGTGAACTATTGTGCCCGGCATTGTACAACCGAACTTTAACAACAGTTGCTCAGATGATGATGGGGATAAAGAGTTGGGAAAGAGCACATCTTCTTGAAATGCTTGCTGGAATATGCTTACTTCTTAAAAGATTATAGAGAATATTGATTCTTCCCCAAGAAATTGACAGATTCATGTTTTACATAATGATATTTGATTGTATAAAGTAATTATGCTGATTTTAAAATGTGAAAACATTGAATATATTTGTAATTTTTTGTTAATAAAGTGCATAATTTTTTTTTGTAGTTTATTCACCTCGACTAGATTTTAATTTTTAATTTTTATTTATTTTTTTGAGACACAGCTTCGCTTGTTACCCAGGCTGGAGTGCAGTGGCATGATCTCGGCTCACCGCAACCTCTGCTTCCCGGGTTCAAGTGATTCTCCTGCCTCAGCCTCCCTAGTAGCTGGGATTACAGGCATGGGCCACCACGCCTGGCTAATTTTTTATATTTTTAGTAGAGACGGGGTTTCTCCATGTTGGTCAGGCTGGTCTTGAACTCCCGACCTCAGGTGATCCGCCTGCCTCAGCCTCCCAAAGTGCCGGGATTACAAGTGTGAGCCACTGCGCCTGGCTGTTTTTTATTTTTAGTAGAGACAAGGTCTTGCTATATTGTCCTGGCTTGTCTTGAACTCCAGGCCTCAAGCAATCCTCCTG
MELK_9_36577630_36579243_36637050_36643005_RF
AGTAGAGATGGGGTTTCACCATGCTGGCCAGGCCAGTCTCAAACTCCTGACCTCAGGTGATCTGCCCGCCCCAGCCTCCCAAAATGCTAGAATTACAGGTGTGAACTATTGTGCCCGGCATTGTACAACCGAACTTTAACAACAGTTGCTCAGATGATGATG GGGATAAAGAGTTGGGAAAGAG CACATCTTCTTGAA ATGCTTGCTGGAATATGCTTAC TTCTTAAAAGATTATAGAGAATATTGATTCTTCCCCAAGAAATTGACAGATTCATGTTTTACATAATGATATTTGATTGTATAAAGTAATTATGCTGATTTTAAAATGTGAAAACATTGAATATATTTGTAATTTTTTGTTAATAAAGTGCATAATTTTTTTTTGTAGTTTATTCACCTCGACTAGATTTTAATTTTTAATTTTTATTTATTTTTTTGAGACACAGCTTCGCTTGTTACCCAGGCTGGAGTGCAGTGGCATGATCTCGGCTCACCGCAACCTCTGCTTCCCGGGTTCAAGTGATTCTCCTGCCTCAGCCTCCCTAGTAGCTGGGATTACAGGCATGGGCCACCACGCCTGGCTAATTTTTTATATTTTTAGTAGAGACGGGGTTTCTCCATGTTGGTCAGGCTGGTCTTGAACTCCCGACCTCAGGTGATCCGCCTGCCTCAGCCTCCCAAAGTGCCGGGATTACAAGTGTGAGCCACTGCGCCTGGCTGTTTTTTATTTTTAGTAGAGACAAGGTCTTGCTATATTGTCCTGGCTTGTCTTGAACTCCAGGCCTCAAGCAATCCTCCTG

Figure 0007005596000051
Figure 0007005596000051

MSH3_5_80021913_80025030_80153948_80159012_RF
TAACAAAAATAAACTTTAAAATGGTGGAGGTGAGTGGGGAAAAGTGAAACCTCTGCTTTACAGAATACCAACGAATAAATGTAGGAAGAATTTTTTAATCAACATTTAATAACGACTATAATAATAACTGATTCAGACAGCAATGATCAATAGATTATAAAACCTTTGGATGAAAGATTGTTGGAGAAAAGGATATTCATATATCTCAAAGTGTCATGCCACAGGTTATTTATTAATTACAAAGGGAAAAGGTATAGTGAAGAAATCTAGTGGGTACCCTCTTCAACCAGATAATCAAATTTGGCATCCCCAGTTATGTAAAACTGATATCACGTCCCACCTGATGTGATGCACTGGGAAGGACCCATCACCTACATATACATGGAATATTCCTGGTATCGAAATATTTTAGGTAATCATTATTTGTCTAATTCACATGTCCACAATCAGGCATTAATGTTTACTTTCATTTGTACCTCACATTCCTGCCAGTCCAGCTTATGTTAGGGTCCATTTTGTGGATGGTGAGGTGAATAGACATTTTCCCTCTTGGCATAAACTTGGCTTCACTCTAATCTTCATCCTACTCCATATGGAGGAAATTTATCTCTGTCACATGCTAGAGAGTGTTCATCATCAGCTCCCCATCACTGCTCCATTTAAGCATCAGTGTCTAGTTAGCATTTCCTTGCATCTAGGCATCAGTGTCTTGTTAGCATGTCTCTTTAATTTCATGATGCCTTGGTCAAATAAAGTGTCTGAGCGTGTATCCCACTTCTTTTTATTTTTTTCTGTAAGGT
MSH3_5_80021913_80025030_80153948_80159012_RF
TAACAAAAATAAACTTTAAAATGGTGGAGGTGAGTGGGGAAAAGTGAAACCTCTGCTTTACAGAATACCAACGAATAAATGTAGGAAGAATTTTTTAATCAACATTTAATAACGACTATAATAATAACTGATTCAGACAGCAATGATCAATAGATTATAAAACCTTTGGATGAAAGATTGTTGGAGAAAAGGATATTCATATATCTC AAAGTGTCATGCCACAGG TTATTTATTAATTACAAAGGGAAAAGGTATAGTGAAGAAATCTAGTGGGTACCCTCTTCAACCAGATAATCAAATTTGGCATCCCCAGTTATGTAAAACTGATATCACGTCCCACCTGATGTGATGCACTGGGA AGGACCCATCACCTACATATAC ATGGAATATTCCTGGTATCGAAATATTTTAGGTAATCATTATTTGTCTAATTCACATGTCCACAATCAGGCATTAATGTTTACTTTCATTTGTACCTCACATTCCTGCCAGTCCAGCTTATGTTAGGGTCCATTTTGTGGATGGTGAGGTGAATAGACATTTTCCCTCTTGGCATAAACTTGGCTTCACTCTAATCTTCATCCTACTCCATATGGAGGAAATTTATCTCTGTCACATGCTAGAGAGTGTTCATCATCAGCTCCCCATCACTGCTCCATTTAAGCATCAGTGTCTAGTTAGCATTTCCTTGCATCTAGGCATCAGTGTCTTGTTAGCATGTCTCTTTAATTTCATGATGCCTTGGTCAAATAAAGTGTCTGAGCGTGTATCCCACTTCTTTTTATTTTTTTCTGTAAGGT

Figure 0007005596000052
Figure 0007005596000052

>NF1_17_29477103_29483764_29651799_29657368_FF
ACTTTCATTTTAATTTATTATTTCCCTTAGAAACATCTCCTATCTTTTGTGACCATGTCTCCTTTTCCAGTATGTTTCTTGAATTAGGATTTCATAGAGCTTTTGTGGCCTACACGAATTGACCACAGTAATCCATTACACATATTTTTCTTTAGCATCTTGTTTGAATTTACTTACGGTTGTCCCAGCCCTAAGTAGATGATAAAATATGATCTCATAGTCCTAAAATGTGGATTGATTTTTTTATGAAGATATGTGTTTTTTCTTCCTTCTGTAACCTGTGACAGATTCTGTAGTAGTTACCCTGTTGTTGAAACAGTTTTTCTCAAATACCAGTTTCATCAAATAATTCCACTGTTAAAAGCTCATAATTTCTTTCTTCTTCCCATTTTCTAAAATCGATTTTTAAATTAAAGGTACAAGTTAAGGCACACAGAAGATTATAGGCAGCTGACCTAGGAGAAAACACAAATGAAGTTGTTTTAAAACGTATTTTTCCTTATAGTTCCAAAATTTTTTCATAACATACAATTTGTGATTCTGTTACAAAGTATGATCAACTATTTTTAAATTTTATGATCAGTTAGAAATAAGATGTTATAATTCTACAGTAAAACCAAAATACCCCTTAATCATTTAGGGATTTTATAAAAAGGGACACACTTGATATAACCATAAGAGCACTGTGAGGCTCCTATGACAGAGGGGCGGGGTATAGGCTTTCCTAAAATACATCTCACTGAGACATAAAATATGAGAGGACTTATGGTCCTAATGTGGATCAATAGAAATTAAGTCAG
> NF1_17_29477103_29483764_29651799_29657368_FF
ACTTTCATTTTAATTTATTATTTCCCTTAGAAACATCTCCTATCTTTTGTGACCATGTCTCCTTTTCCAGTATGTTTCTTGAATTAGGATTTCATAGAGCTTTTGTGGCCTACACGAATTGACCACAGTAATCCATTACACATATTTTTCTTTAGCATCTTGTTTGAATTTACTTACGGTTGTCCCAGCCCTAAGTAGATGATAAAATATGATCTCATAGTCCTAAAATGTGGATTGATTTTTTTATGAAGATATGTGTTTT TTCTTCCTTCTGTAACCTGTG ACAGATTC TGTAGTAGTTACCCTGTTGTTG AAACAGTTTTTCTCAAATACCAGTTTCATCAAATAATTCCACTGTTAAAAGCTCATAATTTCTTTCTTCTTCCCATTTTCTAAAATCGATTTTTAAATTAAAGGTACAAGTTAAGGCACACAGAAGATTATAGGCAGCTGACCTAGGAGAAAACACAAATGAAGTTGTTTTAAAACGTATTTTTCCTTATAGTTCCAAAATTTTTTCATAACATACAATTTGTGATTCTGTTACAAAGTATGATCAACTATTTTTAAATTTTATGATCAGTTAGAAATAAGATGTTATAATTCTACAGTAAAACCAAAATACCCCTTAATCATTTAGGGATTTTATAAAAAGGGACACACTTGATATAACCATAAGAGCACTGTGAGGCTCCTATGACAGAGGGGCGGGGTATAGGCTTTCCTAAAATACATCTCACTGAGACATAAAATATGAGAGGACTTATGGTCCTAATGTGGATCAATAGAAATTAAGTCAG

Figure 0007005596000053
Figure 0007005596000053

>SRD5A1_5_6634973_6639025_6667775_6669711_RF
ACCACTTTTTAAGATTTATCCTGTTTGTTCTTTGTTGATTGAAACATAATAATTGTTAAAATTCTCTACAGCCTTCTTTTTCTTCCATAGCTAATCTTCCTTCTAATAGTTTTTGCTTTCTGTTTTGCTGTTGTTGCTTTGCAAAGCTTTCCCCTCATAGCCTGTACCTGTTATCAATATAAAATAATCTTCCTGTTGAATGCTTCATGACTTGAATTCTACTTTGATAAAAACATTGCCATACTGCTTTTTATCTTGATGAATTCATCTGGCATTGCTTTGCCTTATCATCTCATCTGGAGTTTTTAAATGCCATTTGTTTCAGTTGTCTTTAACAACATAATAAATAGACTTTGCCATTTAACAAGGTAGCTCAAATTCTTTTACTAATTGTTACATCGAAAGTTCAAAATTAAATTTTAAACGTTTTCATTCAGGCTCTGGAAAGCTTCACAGTTAAAAAGGATGTCTCTACACCCAAGGAAGTTGAACTCACTGGCTGTGTGACTATGGGCAGTTTACCCAACCTTTCTGATTTGGGGTCCCACCTTAAAACACTCACTTCCCAGAGAGACAGGAAGAACTCAGTGTGTGTTTATAAGCCTCTCTTCTTTCTCCTGGTGTCATGCATTCCAGCGAAGAGAAAGTACACAGCTCCACTACTTGGAACCAGTGTTGTACCCAGCACAGTTTTTGGTACCTGAGTTCCCTGAAAACCAGCACCTTACCCTGTAACTGGTGCAGTCTGTGTCCTCAGTGTGCTTTGATGACTTGCACTTTAAACAAGGGCAAGTCAACAT
> SRD5A1_5_6634973_6639025_66677775_6669711_RF
ACCACTTTTTAAGATTTATCCTGTTTGTTCTTTGTTGATTGAAACATAATAATTGTTAAAATTCTCTACAGCCTTCTTTTTCTTCCATAGCTAATCTTCCTTCTAATAGTTTTTGCTTTCTGTTTTGCTGTTGTTGCTTTGCAAAGCTTTC CCCTCATAGCCTGTACCTG TTATCAATATAAAATAATCTTCCTGTTGAATGCTTCATGACTTGAATTCTACTTTGATAAAAACATTGCCATACTGCTTTTTATCTTGATGAATTCATCT GGCATTGCTTTGCCTTATC ATCTCATCTGGAGTTTTTAAATGCCATTTGTTTCAGTTGTCTTTAACAACATAATAAATAGACTTTGCCATTTAACAAGGTAGCTCAAATTCTTTTACTAATTGTTACATCGAAAGTTCAAAATTAAATTTTAAACGTTTTCATTCAGGCTCTGGAAAGCTTCACAGTTAAAAAGGATGTCTCTACACCCAAGGAAGTTGAACTCACTGGCTGTGTGACTATGGGCAGTTTACCCAACCTTTCTGATTTGGGGTCCCACCTTAAAACACTCACTTCCCAGAGAGACAGGAAGAACTCAGTGTGTGTTTATAAGCCTCTCTTCTTTCTCCTGGTGTCATGCATTCCAGCGAAGAGAAAGTACACAGCTCCACTACTTGGAACCAGTGTTGTACCCAGCACAGTTTTTGGTACCTGAGTTCCCTGAAAACCAGCACCTTACCCTGTAACTGGTGCAGTCTGTGTCCTCAGTGTGCTTTGATGACTTGCACTTTAAACAAGGGCAAGTCAACAT

Figure 0007005596000054
Figure 0007005596000054

>TSPYL5_8_98276431_98282736_98316421_98318720_FF
TAAAGAAGTTTCACATTCATATGCCAACTCAGATTGATGGGCAGCAACTGGATAATCCGCTGTGCAGAAAGTTAAATACAGGTTCTGTGCAAAGAAGTGTCTAGATTCATAGTGCCAGACATCTGCCCTGGGCCACATGCTTACCGTCCCATGGATGGATGGAACTTGGAATCAGAAGACCCAAGTTTGAGTCCTGGCTCTACTACTTTTGTGATTTTGGTCATTTAACCTCTTTGAGCCTTCTTATGGCATAGTAGTTATAATCAAGATAATATAAGTGAATGTGCTTTGTAAACCATGAAGTGTTGGTCACACAGATGATAGCTACTGTCTTATATTTGTCAAACCTCAGCTGAGGACCAGGTTGACAGGATGGAGGAAGAGGAGGAATTCAAGACTCGAACTAAACAAAAAGGAGATGATCCTGGGTGGGCTTGACTTAATCAAGTGAAAGCCTTAAAAGCAAGAGTCTCCTGCTAGTCTAGGAAAAGCAAACAGCCCTGCTATGAATGGCCTATAGAAAGGGGCAGCCTCTAGGAGCATGGGCCTCAGTCATATGCCCACGAGGAACTGAATATTGCCAGCAACCATGTGAGCATGGAAGAGGACTCTAAGCCTCTGATGAGACCACAGCCCTGGCCAATGCTTTGATTGTGGCTCTGTGAGGCCTTGAACAAAGGACCAAGTATAGCTATGCCAGGACTTCTGAACCACGGGAATGGTGAGATAATAAATGTTTGGTGTTTTAAGCCACTAAGTTTGTGTTAATTTTTTATGCCGCAATAGAAAGCGAATACTAC
> TSPYL5_8_98276431_98282736_98316421_98318720_FF
TAAAGAAGTTTCACATTCATATGCCAACTCAGATTGATGGGCAGCAACTGGATAATCCGCTGTGCAGAAAGTTAAATACAGGTTCTGTGCAAAGAAGTGTCTAGATTCATAGTGCCAGACATCTGCCCTGGGCCACATGCTTACCGTCCCATGGATGGATGGAACTTGGAATCAGAAGACCCAAGT TTGAGTCCTGGCTCTACTAC TTTTGTGATTTTGGTCATTTAACCTCTTTGAGCCTTCTTATGGCATAGTAGTTATAATCAAGATAATATAAGTGAAT GTGCTTTGTAAACCATGAAGTG TTGGTCACACAGATGATAGCTACTGTCTTATATTTGTCAAACCTCAGCTGAGGACCAGGTTGACAGGATGGAGGAAGAGGAGGAATTCAAGACTCGAACTAAACAAAAAGGAGATGATCCTGGGTGGGCTTGACTTAATCAAGTGAAAGCCTTAAAAGCAAGAGTCTCCTGCTAGTCTAGGAAAAGCAAACAGCCCTGCTATGAATGGCCTATAGAAAGGGGCAGCCTCTAGGAGCATGGGCCTCAGTCATATGCCCACGAGGAACTGAATATTGCCAGCAACCATGTGAGCATGGAAGAGGACTCTAAGCCTCTGATGAGACCACAGCCCTGGCCAATGCTTTGATTGTGGCTCTGTGAGGCCTTGAACAAAGGACCAAGTATAGCTATGCCAGGACTTCTGAACCACGGGAATGGTGAGATAATAAATGTTTGGTGTTTTAAGCCACTAAGTTTGTGTTAATTTTTTATGCCGCAATAGAAAGCGAATACTAC

>CDC6_17_38421089_38423079_38467677_38474960_FR
AGGTAAGTTAAAGACCAAGAACTGGCATTGGTCTTAGTATCATGGGACCCTTTTGAGTAGTTTCAGTGGAGTGGTGGAGGGTGAAAGTGAAAGCTTAATTGGAGTGGGTTCAAGAATGCAGGAATAGGAGGAGAGAAATTGGAGATAGCAATATAGAAATCTCTTAAAGAGTTCGCTGTAAAGTCCAGGAGAGAGGGGTGAAGATAAGTGAAGTGATTGTTGGACGAAGATGTGGGGTTGAGAGTTGTTTTTTTCCCATCCCAAGATGGGAGACCTATTTGTATGCTGATGGAATGAGTAGCATGAAACTTAGGAGAGAGGGAAAAAATTGAATCAGAAGAGAGGGAACAGATTGCCTGAATAATGACCTGGAGGAGGCCAGAGAAAAGAGAATGTGATCGATGACCTTAATGTCAGTGTCACTGACTCTGACAAGGAGGAAAGGACAGCGATGAGCCAGGCTGACCCCCGCCACCCCATTCCCATAGCCCCACTTTCTTCTCTCTTCTTGTTCAGAAATGTTTCACTTTGCCTCATCTAGCCCCTTTGGCCAGTAGGTCACATCTGGGAGCTTCTGGGGGTGCCACATGTCTGCCTCAATCTGGGCTGTTTCCTCCCCTCCAAGATATTTCACTGTCTCTGGGCTGGGCGCCAGGACTCCTGGGTTTCCCTGCCTGTGGTGCAGGGCTCCCCTGCAGGGCTCCAGAGAGTCGCTTAGCTGGTTTCCTTCCTCCTTTGTGGGGAGGGCCTTCCCCTAGGGCTGGGAGGTGTCAGGAATCCCAGGTGGGACAGGGGTGGGG
> CDC6_17_3841089_38423079_38467677_384747960_FR
AGGTAAGTTAAAGACCAAGAACTGGCATTGGTCTTAGTATCATGGGACCCTTTTGAGTAGTTTCAGTGGAGTGGTGGAGGGTGAAAGTGAAAGCTTAATTGGAGTGGGTTCAAGA ATGCAGGAATAGGAGGAGAG AAATTGGAGATAGCAATATAGAAATCTCTTAAAGAGTTCGCTGTAAAGTCCAGGAGAGAGGGGTGAAGATAAGTGAAGTGATTGTTGGACGAAGATGTGGGGTTGAGAGTTGTTTTTTTCCCATCCCAAGATGGGAGACCTATTTGTATGCTGATGGAATGAGTA GCATGAAACTTAGGAGAGAGG GAAAAAATTGAATCAGAAGAGAGGGAACAGATTGCCTGAATAATGACCTGGAGGAGGCCAGAGAAAAGAGAATGTGATCGATGACCTTAATGTCAGTGTCACTGACTCTGACAAGGAGGAAAGGACAGCGATGAGCCAGGCTGACCCCCGCCACCCCATTCCCATAGCCCCACTTTCTTCTCTCTTCTTGTTCAGAAATGTTTCACTTTGCCTCATCTAGCCCCTTTGGCCAGTAGGTCACATCTGGGAGCTTCTGGGGGTGCCACATGTCTGCCTCAATCTGGGCTGTTTCCTCCCCTCCAAGATATTTCACTGTCTCTGGGCTGGGCGCCAGGACTCCTGGGTTTCCCTGCCTGTGGTGCAGGGCTCCCCTGCAGGGCTCCAGAGAGTCGCTTAGCTGGTTTCCTTCCTCCTTTGTGGGGAGGGCCTTCCCCTAGGGCTGGGAGGTGTCAGGAATCCCAGGTGGGACAGGGGTGGGG

>SLC16A10_6_111441989_111447305_111492951_111498421_FR
TTCAATTGCTATATAAAAAATGTAAAGTCTGTTTACTGCCTTAAACCTTCTGGTGTATTTTTATATAAAGTAACACCCTTAATTCTAACTTGGCCAACAGGTAGGATGGTATTATTATTATCTTCATTGTACAGATAAGGAAACTGAGGCTCAGATTGACTAGATCAAACAGGAGTTTTCTGGAAAACCTAGGACACAAGCCTAAATCTTTGAACTCAAATACTGCTCTACACTGAATTACAGTTATATACTGATTTCTGTTGTAAATTCTTAGAGAAGACAGACATAGAAATTAGTAACTTGAGTCAGTAGCGGCTTTGTTCAAACACAGGCACATGCATATTTTATGGTATATGTTTATATCTGTGTAATACTCATCATAAATGTCAGATTTATAATCGAGATCACAGTGAGCTGAGATTGCACCACTGCACTCCAGCCTGGGCAGCGGAGTGAGACCTTTTCTCAAAAAAAAAAAAAAAAAAAGGCAAAAAATTAAATTATTAGTATGGTAAAGTTTCGTTTGGACTTAATATGAAACTCATTTCTAGAAATGATGATCATTTGCATAGGGCTTAACTTCCTTTGCTAAGAAAATAGAGTAGTATACTAGGAGACTTCCAGAGCTGCATAGAGCTTCAGGGTCATCTACCAAGACAGACAATTTGTTGTCATCATCAGTGTTAAACTCTAAATTATTAAGTGCTTATGTGCCAGATACTGAAGTTTATATACACTTTCTCTAATCTTTAATAATTCTAGAAAGGTATGTGTTTGATCCATTTTCAAGATAAGAAAAC
> SLC16A10_6_111441989_111447305_1114922951_111494421_FR
TTCAATTGCTATATAAAAAATGTAAAGTCTGTTTACTGCCTTAAACCTTCTGGTGTATTTTTATATAAAGTAACACCCTTAATTCTAACTTGGCCAACAGGTAGGATGGTATTATTATTATCTTCATTGTACAGATAAGGAAACTGAGGCTCAGATTGACTAGATCAAACAGGAGTTTTCTGGAAAA CCTAGGACACAAGCCTAAATC TTTGA ACTCAAATACTGCTCTACACTG AATTACAGTTATATACTGATTTCTGTTGTAAATTCTTAGAGAAGACAGACATAGAAATTAGTAACTTGAGTCAGTAGCGGCTTTGTTCAAACACAGGCACATGCATATTTTATGGTATATGTTTATATCTGTGTAATACTCATCATAAATGTCAGATTTATAATCGAGATCACAGTGAGCTGAGATTGCACCACTGCACTCCAGCCTGGGCAGCGGAGTGAGACCTTTTCTCAAAAAAAAAAAAAAAAAAAGGCAAAAAATTAAATTATTAGTATGGTAAAGTTTCGTTTGGACTTAATATGAAACTCATTTCTAGAAATGATGATCATTTGCATAGGGCTTAACTTCCTTTGCTAAGAAAATAGAGTAGTATACTAGGAGACTTCCAGAGCTGCATAGAGCTTCAGGGTCATCTACCAAGACAGACAATTTGTTGTCATCATCAGTGTTAAACTCTAAATTATTAAGTGCTTATGTGCCAGATACTGAAGTTTATATACACTTTCTCTAATCTTTAATAATTCTAGAAAGGTATGTGTTTGATCCATTTTCAAGATAAGAAAAC

>VAV3_1_108148303_108158073_108220200_108227533_RF
ATGAGGTTTTTTTCCAGCCTTCCTAAGGGCCTCAAAGTCATATCCAGCAGACTTGCAGGGTTCTCAGGTGAAAGCAAATTGGAGAAATTTTTAAAATGTAATTTTGGTTTTTACTCCAACTACTTTCAACATGGATTTGTAAAAGACTGCTAGGATCATTAAAATCAGCATTGAAGCTATGTTGAGCAAGATGGATAGCTGCACTAGAAAAGCTGTAACAAGAGTCATTGTGAATGAAAGGAAAATTTTGCTCTAGATTTGTTGGTAGCCAAGGCACAAAAATTGGAAGCATAATGAGTTACAGACTCATGTCTGATAATATGAAAGAACACTAATTTAAAGAAAAAATCTTTTCTGTCTGAAATTTTATAATTTAGAGGAACTCTATATAAACAACATCGAAACTTTGCTTCATGCACAAAATTTAAAATATTACATAAAATTACCTTCAGGCTTTGTGTATAAGATATATATAAAACATAAATAAATTTTGTGTTTACACTTGGGTTCCATCCTGAATATATCTCATGATGTTTATGCAAATATTCCAAAATCTGAAAAAATCTGAAATTCAAAACACTTCCGGTCCCAAGCATTTTGAATAAGGGATACTCAACCTATAGCTGCATTAATTGAATTAAGACAACCACATAATCTACCTGTTAATTTTCTCTGGAGCCTTTTCTTCTGAGCCCTCCACGCTCTTCTAATTGATACTGCTTGCTCTACTAAGCCTGTTGAATTACTGTAGTCCTGGGACTTCTCTTTGCTCCCCTTTCCTGGCTTCTATATCTCCCTCT
> VAV3_1_108148303_10815873_108220200_108227533_RF
ATGAGGTTTTTTTCCAGCCTTCCTAAGGGCCTCAAAGTCATATCCAGCAGACTTGCAGGGTTCT CAGGTGAAAGCAAATTGGAG AAATTTTTAAAATGTAATTTTGGTTTTTACTCCAACTACTTTCAACATGGATTTGTAAAAGACTGCTAGGATCATTAAAATCAGCATTGAAGCTA TGTTGAGCAAGATGGATAGC TGCACTAGAAAAGCTGTAACAAGAGTCATTGTGAATGAAAGGAAAATTTTGCTCTAGATTTGTTGGTAGCCAAGGCACAAAAATTGGAAGCATAATGAGTTACAGACTCATGTCTGATAATATGAAAGAACACTAATTTAAAGAAAAAATCTTTTCTGTCTGAAATTTTATAATTTAGAGGAACTCTATATAAACAACATCGAAACTTTGCTTCATGCACAAAATTTAAAATATTACATAAAATTACCTTCAGGCTTTGTGTATAAGATATATATAAAACATAAATAAATTTTGTGTTTACACTTGGGTTCCATCCTGAATATATCTCATGATGTTTATGCAAATATTCCAAAATCTGAAAAAATCTGAAATTCAAAACACTTCCGGTCCCAAGCATTTTGAATAAGGGATACTCAACCTATAGCTGCATTAATTGAATTAAGACAACCACATAATCTACCTGTTAATTTTCTCTGGAGCCTTTTCTTCTGAGCCCTCCACGCTCTTCTAATTGATACTGCTTGCTCTACTAAGCCTGTTGAATTACTGTAGTCCTGGGACTTCTCTTTGCTCCCCTTTCCTGGCTTCTATATCTCCCTCT

二重標識加水分解プローブを用いて、5’-FAM/BHQ1-3’で標識された配列決定済みの相互作用を検出した。プローブは温度勾配最適化され、3C断片の接合部をまたぐように設計され、3C産物を完全に特異的に検出させる。qPCR標準曲線(10コピー~1コピー)を、報告書の図で使用した配列決定済みの産物から作成した。 A double-labeled hydrolysis probe was used to detect 5'-FAM / BHQ1-3'labeled sequenced interactions. The probe is temperature gradient optimized and designed to straddle the junction of 3C fragments to detect 3C products in a completely specific manner. qPCR standard curves ( 106 to 1 copy) were made from the sequenced products used in the figures in the report.

3Cライブラリー作製のための内部対照としてのMMP1コピー試験。 MMP1 copy test as an internal control for 3C library fabrication.

使用したプライマーセットおよびプローブを以下の参照配列に示す。Taq I部位を強調表示してある。プローブは、両方の断片の接合部にまたがり、66.4℃のアニーリング温度において特異的である。 The primer set and probe used are shown in the reference sequence below. The Taq I site is highlighted. The probe straddles the junction of both fragments and is specific at an annealing temperature of 66.4 ° C.

GGGGAGTGGATGGGATAAGGTGGAATGTTGGGTGAACTAAAAGGCCTTTAAGGCCCCTCTGAAATCCAGCATCGAAGAGGGAAACTGCATCACAGTTGATGGAAGTCTGTTGGCCTCTTAACAAAGCTAATGCTTGCCCTTCTGGCTTAGCTTACATAAGAACCACAAGGAATCTTTGTTGAATTGTTTCTTTCAGATCATCGGGACAACTCTCCTTTTGATGGACCTGGAGGAAATCTTGCTCATGCTTTTCAACCAGGCCCA
MMP 1-4 2F 5’-GGGGAGTGGATGGGATAAGGTG-3’
MPP 1F 5’-TGGGCCTGGTTGAAAAGCAT-3’
MMP1F1b2プローブ 5’-FAM-ATCCAGCATCGAAGAGGGAAACTGCATCA-BHQ1-3’
GGGGAGTGGATGGGATAAGGTGGAATGTTGGGTGAACTAAAAGGCCTTTAAGGCCCCTCTGAAATCCAGCATCGAAGAGGGAAACTGCATCACAGTTGATGGAAGTCTGTTGGCCTCTTAACAAAGCTAATGCTTGCCCTTCTGGCTTAGCTTACATAAGAACCACAAGGAATCTTTGTTGAATTGTTTCTTTCAGATCATCGGGACAACTCTCCTTTTGATGGACCTGGAGGAAATCTTGCTCATGCTTTTCAACCAGGCCCA
MMP 1-4 2F 5'-GGGGAGTGGATGGATAAGGTG-3'
MPP 1F 5'-TGGGCCTGGTGAAAAGCAT-3'
MMP1F1b2 probe 5'-FAM-ATCCAGCATCGAAGAGGAAACTGCATCA-BHQ1-3'

加水分解qPCRについてのフォワードおよびリバースプライマーならびにプローブ配列は、前の表に記載されている。 Forward and reverse primers and probe sequences for hydrolyzed qPCR are listed in the previous table.

内部対照マーカーMMP1を用いた3Cライブラリーコピー数試験。 3C library copy count test using internal control marker MMP1.

MMP-1との3C相互作用を、EpiSwitch(商標)ライブラリーの内部対照として用いた。二重標識5’FAM-BHQ1-3’により標識された加水分解プローブを用いて、配列決定済みの相互作用を検出した。サンプルを20ngでスクリーニングし、コピー数を記録した。上記のように264bp産物を定量し、すべてのサンプルを3C標的でスクリーニングする前にLabChip上で実行した。標的は各実験のMMP1比として表した。 A 3C interaction with MMP-1 was used as an internal control in the EpiSwitch ™ library. Hydrolyzed probes labeled with double-labeled 5'FAM-BHQ1-3'was used to detect sequenced interactions. Samples were screened at 20 ng and the number of copies was recorded. 264bp products were quantified as described above and performed on LabChip before screening all samples with 3C targets. Targets were expressed as the MMP1 ratio for each experiment.

標準曲線によるqPCRスクリーニングおよび3C断片コピー数の推定。 QPCR screening and estimation of 3C fragment copy number by standard curve.

qPCRテンプレートを20ngの3CライブラリーDNAに適合させ、正常血液由来の3Cライブラリーを含む濃度一致の陰性対照に使用した。さらなる陰性対照には、ホルムアルデヒド固定を伴わない患者の材料、消化および連結されたライブラリー材料、および正常ゲノムDNAが含まれた。3C相互作用MMP-1を、EpiSwitch(商標)ライブラリー合成のための内部対照として使用した。 The qPCR template was adapted to 20 ng of 3C library DNA and used as a concentration-matched negative control containing a 3C library from normal blood. Additional negative controls included patient material without formaldehyde fixation, digested and linked library material, and normal genomic DNA. The 3C interaction MMP-1 was used as an internal control for the synthesis of the EpiSwitch ™ library.

本発明者らは、HEX、テキサスレッド、およびFAMを、一致するクエンチャーと共に使用した。 We used HEX, Texas Red, and FAM with matching quenchers.

Figure 0007005596000055
Figure 0007005596000055

配列表1 <223>核酸配列について「nはa、c、g、またはtである」 Sequence Listing 1 <223> Nucleic acid sequence "n is a, c, g, or t"

Claims (12)

特定のエピジェネティックな染色体相互作用の存在を含む、乳癌ヒトサブグループを表す染色体の状態を決定するプロセスであって、ヒト個体からの試料において、A process that determines the state of chromosomes that represent the human subgroup of breast cancer, including the presence of specific epigenetic chromosomal interactions, in samples from individual humans.
(i)以下のプローブ(マーカーセット3):(I) The following probe (marker set 3):
TTGGAGGGAAAAGTAATTACGTTCAACTTCGACTGTATTCTACAAAGTGCTGGGATTACA;TTGGAGGGAAAAGTAATTTACGTTCAACTTCGACTGTATTTACCAAAAGTGCTGGATTACA;
GGAGGAGGCCAGAGAAAAGAGAATGTGATCGATTTCTAAAATACTGTGTGTGTGTATGTA;GGAGGAGGCCAGAGAAAAGAAGATGTGATCGATTTCTAAAATACATGTGTGTGTGTATTGTA;
GGAGGAGGCCAGAGAAAAGAGAATGTGATCGATGACCTTAATGTCAGTGTCACTGACTCT;GGAGGAGGCCAGAGAAAAGAAGATGTGATCGACACTTAATGTCAGTGTCACTGACTCT;
CAGAAATGCACGCACAGGCACAACAGCATCGAAACCGGTTCTTTGGAGGCTCAGTTTTTG;CAGAAATGCACGCAGAGGCACAACAGCATCGAAACCGGGTTCTTTGGAGGCTCAGTTTTG;
CCAAAGACAGCCAAGGAAAAACTAAAGATCGAAAGTTTTTATTACTTCCAAATTAGTAAA;CCAAAGACAGCCAAAGGAAAAAACTAAAGATCCGAAAGTTTTTTATTACTTCAAATTAGTAAA;
AGGATCTCATGATGCTTTGAATACTTTCTCGATACCTTATTATAAAATCAGCTTTGTGTT;AGGATCTCATGATGCTTTGAATACTTTCTCGATACCTTATTATAAAATCAGCTTTGTGTT;
CATAATTTTTTTTTGTAGTTTATTCACCTCGACTAGATTTTAATTTTTAATTTTTATTTA;CATAATTTTTTTTTGTAGTTTTTACTCCGACTAGATTTTTAATTTTTAATTTTTTTA;
CCTACATATACATGGAATATTCCTGGTATCGAAATATTTTAGGTAATCATTATTTGTCTA;CCTACATACATGGGAATATTCCTGGTTACGAAAATTTTTAGGTAACATCATATTTTGTTAC;
ATTTCTTTCTTCTTCCCATTTTCTAAAATCGATTTTTAAATTAAAGGTACAAGTTAAGGC;ATTTCTTTCTTCTTCCCACTTTTCTAAAATCCGATTTTTAAAATTAAAGGTACAAGTTAAGGC;
ATACTCATCATAAATGTCAGATTTATAATCGAGATCACAGTGAGCTGAGATTGCACCACT;ATACTCATCATAATAGTCAGAATTTAATATCGAGATACACAGTGAGCTGAGAATTGCACCACT;
AGCTCAAATTCTTTTACTAATTGTTACATCGAAAGTTCAAAATTAAATTTTAAACGTTTT;AGCTCAAATTTTTTTACTAATTGTTACCATCCGAAAAGTTCAAAATTAAATTTTTAAAACGTTT;
GGATGGAGGAAGAGGAGGAATTCAAGACTCGAACTAAACAAAAAGGAGATGATCCTGGGT;GGATGGAGGAAGAGGAATTCAAGACTCGAACTAAACAAAAAGGAGAGGATCCTGGT;
AATTTAGAGGAACTCTATATAAACAACATCGAAACTTTGCTTCATGCACAAAATTTAAAA;またはAATTTAGAGGAACTCTATATAAAACAACATCCGAAACTTTTGCTTCCATGCACAAAATTTAAAA; or
(ii)以下のプローブ(マーカーセット1):(Ii) The following probe (marker set 1):
ATTTCTTTCTTCTTCCCATTTTCTAAAATCGATTTTTAAATTAAAGGTACAAGTTAAGGC;ATTTCTTTCTTCTTCCCACTTTTCTAAAATCCGATTTTTAAAATTAAAGGTACAAGTTAAGGC;
GGATGGAGGAAGAGGAGGAATTCAAGACTCGAACTAAACAAAAAGGAGATGATCCTGGGT;GGATGGAGGAAGAGGAATTCAAGACTCGAACTAAACAAAAAGGAGAGGATCCTGGT;
AGCTCAAATTCTTTTACTAATTGTTACATCGAAAGTTCAAAATTAAATTTTAAACGTTTT;AGCTCAAATTTTTTTACTAATTGTTACCATCCGAAAAGTTCAAAATTAAATTTTTAAAACGTTT;
CCAAAGACAGCCAAGGAAAAACTAAAGATCGAAAGTTTTTATTACTTCCAAATTAGTAAA;CCAAAGACAGCCAAAGGAAAAAACTAAAGATCCGAAAGTTTTTTATTACTTCAAATTAGTAAA;
AATTTAGAGGAACTCTATATAAACAACATCGAAACTTTGCTTCATGCACAAAATTTAAAA;AATTTAGAGGAACTCTATATAAAACAACATCCGAAACTTTTGCTTCCATGCACAAAATTTAAAA;
TTGGAGGGAAAAGTAATTACGTTCAACTTCGACTGTATTCTACAAAGTGCTGGGATTACA;TTGGAGGGAAAAGTAATTTACGTTCAACTTCGACTGTATTTACCAAAAGTGCTGGATTACA;
ATACTCATCATAAATGTCAGATTTATAATCGAGATCACAGTGAGCTGAGATTGCACCACT;ATACTCATCATAATAGTCAGAATTTAATATCGAGATACACAGTGAGCTGAGAATTGCACCACT;
AGGATCTCATGATGCTTTGAATACTTTCTCGATACCTTATTATAAAATCAGCTTTGTGTT;またはAGGATCTCATGATGCTTTGAATACTTTCTCGATACCTTATTATAAAATCAGCTTTGTGTT; or
(iii)以下のプローブ(マーカーセット2):(Iii) The following probes (marker set 2):
TTGGAGGGAAAAGTAATTACGTTCAACTTCGACTGTATTCTACAAAGTGCTGGGATTACA;TTGGAGGGAAAAGTAATTTACGTTCAACTTCGACTGTATTTACCAAAAGTGCTGGATTACA;
GGAGGAGGCCAGAGAAAAGAGAATGTGATCGATTTCTAAAATACTGTGTGTGTGTATGTA;GGAGGAGGCCAGAGAAAAGAAGATGTGATCGATTTCTAAAATACATGTGTGTGTGTATTGTA;
GGATGGAGGAAGAGGAGGAATTCAAGACTCGAACTAAACAAAAAGGAGATGATCCTGGGT;GGATGGAGGAAGAGGAATTCAAGACTCGAACTAAACAAAAAGGAGAGGATCCTGGT;
AGGATCTCATGATGCTTTGAATACTTTCTCGATACCTTATTATAAAATCAGCTTTGTGTT;AGGATCTCATGATGCTTTGAATACTTTCTCGATACCTTATTATAAAATCAGCTTTGTGTT;
AGCTCAAATTCTTTTACTAATTGTTACATCGAAAGTTCAAAATTAAATTTTAAACGTTTT;AGCTCAAATTTTTTTACTAATTGTTACCATCCGAAAAGTTCAAAATTAAATTTTTAAAACGTTT;
AATTTAGAGGAACTCTATATAAACAACATCGAAACTTTGCTTCATGCACAAAATTTAAAA;AATTTAGAGGAACTCTATATAAAACAACATCCGAAACTTTTGCTTCCATGCACAAAATTTAAAA;
CAGAAATGCACGCACAGGCACAACAGCATCGAAACCGGTTCTTTGGAGGCTCAGTTTTTG;CAGAAATGCACGCAGAGGCACAACAGCATCGAAACCGGGTTCTTTGGAGGCTCAGTTTTG;
CCTACATATACATGGAATATTCCTGGTATCGAAATATTTTAGGTAATCATTATTTGTCTACCTACATACATGGGAATATTCCTGGTATCCGAAAATTTTTAGGTAACATCATATTTTGTTA
によって表される染色体相互作用のすべての有無を決定することを含む、プロセス。A process that involves determining the presence or absence of all chromosomal interactions represented by.
前記染色体相互作用の有無が、
記染色体相互作用の部位におけるDNAループの有無を検出する工程によって決定される、請求項1に記載のプロセス。
The presence or absence of the chromosomal interaction
The process according to claim 1, which is determined by the step of detecting the presence or absence of a DNA loop at the site of chromosomal interaction.
前記染色体相互作用の有無が、染色体コンホーメーョンにおいて接合される染色体の遠位領域の有無を検出する工程によって決定される、請求項1に記載のプロセス。 The process of claim 1, wherein the presence or absence of the chromosomal interaction is determined by the step of detecting the presence or absence of a distal region of the chromosome to be joined in a chromosomal conformation. 前記染色体相互作用の有無が、The presence or absence of the chromosomal interaction
(i)染色体相互作用において一体となる染色体の領域をインビトロで架橋して、連結DNAを生成する工程;(I) The step of cross-linking the region of the chromosome that is integrated in the chromosomal interaction in vitro to generate linked DNA;
(ii)前記架橋DNAに、切断または制限消化による切断を施す工程;(Ii) A step of cleaving the crosslinked DNA by cleavage or restriction digestion;
(iii)前記架橋DNAを連結して、連結DNAを形成する工程;および(Iii) A step of linking the crosslinked DNA to form linked DNA; and
(iv)前記連結DNAの有無を検出し、それにより染色体相互作用の有無を決定する工程(Iv) A step of detecting the presence or absence of the linked DNA and thereby determining the presence or absence of chromosomal interaction.
を含む方法によって決定される、請求項1に記載の方法。The method according to claim 1, which is determined by a method comprising.
記連結核酸の検出が、PCRによって実施される、請求項4に記載のプロセス。 The process of claim 4, wherein the detection of the linked nucleic acid is carried out by PCR. 前記PCRは、以下のプライマーの少なくとも1つを使用する請求項5に記載の方法:The method of claim 5, wherein the PCR uses at least one of the following primers:
TGTAGTAGTTACCCTGTTGTTG;TGTAGTAGTTACCCTGTTGTG;
GCCTCACAGTGCTCTTATG;GCCTCAGAGTGCTCTTAG;
GTGCTTTGTAAACCATGAAGTG;GTGCTTTGTAAACCATGAAGTG;
TCGTGGGCATATGACTGAG;TCGTGGGGCATTGACTGAG;
GGCATTGCTTTGCCTTATC;GGCATTGCTTTGCCTTAC;
CAACTTCCTTGGGTGTAGAG;CAACTTCCTTGGGTGTAGAG;
CGCTATATGTGGTTCTGTACG;CGCTATATGTGGTTCTGTACG;
CTTCTCTAAAGGGAGATTTGGG;CTTCTTAAAAGGAGATTTGGG;
TGTTGAGCAAGATGGATAGC;TGTTGAGCAAGGGATAGC;
ATATTCAGGATGGAACCCAAG;ATTTCAGGATGGAACCCAAG;
TCCAGAGGTTATGGAATTTGAG;TCCAGAGGTTTAGGAATTTGAG;
AAGAAACAGACTGGGCTTG;AAGAAACAGACTGGGCTTG;
ACTCAAATACTGCTCTACACTG;ACTCAAATATCTGCTTACACTG;
AAGGAAGTTAAGCCCTATGC;AAGGAAGTTAAGCCTATGC;
ACCCTCCTTCACTCACATAG;またはACCCTCCTTCACTCACATAG; or
GCACCTAATCTACCTAACATCAC。GCACCTAACTTACTACTAACATCAC.
前記連結DNAの有無は、前記連結産物を増幅することができるプライマー、およびPCR反応の間に前記連結部位に結合するプローブを使用する定量的PCR(qPCR)により検出され、前記プローブが、前記染色体相互作用において一体となる染色体領域のそれぞれからの配列に相補的な配列を含む、請求項4に記載のプロセス。 The presence or absence of the linked DNA is detected by quantitative PCR (qPCR) using a primer capable of amplifying the linked product and a probe that binds to the linked site during the PCR reaction. The process of claim 4, comprising sequences complementary to sequences from each of the chromosomal regions that are integrated in the chromosomal interaction. 前記プローブが、前記オリゴヌクレオチドの5’末端に共有結合したフルオロフォアを含む、請求項7に記載のプロセス。The process of claim 7, wherein the probe comprises a fluorophore covalently attached to the 5'end of the oligonucleotide. 前記プローブが、前記オリゴヌクレオチドの3’末端に共有結合したクエンチャーを含む、請求項7に記載のプロセス。The process of claim 7, wherein the probe comprises a quencher covalently attached to the 3'end of the oligonucleotide. 前記フルオロフォアが、HEX、テキサスレッドおよびFAMから選択される、請求項8に記載のプロセス。The process of claim 8, wherein the fluorophore is selected from HEX, Texas Red and FAM. 前記プローブが、10~40ヌクレオチド塩基長の核酸配列を含む、請求項7に記載のプロセス。The process of claim 7, wherein the probe comprises a nucleic acid sequence having a base length of 10-40 nucleotides. 前記プローブが、20~30ヌクレオチドの塩基長を有する、請求項11に記載のプロセス。11. The process of claim 11, wherein the probe has a base length of 20-30 nucleotides.
JP2019510481A 2016-05-06 2017-05-08 Detection of chromosomal interactions associated with breast cancer Active JP7005596B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1608000.4 2016-05-06
GBGB1608000.4A GB201608000D0 (en) 2016-05-06 2016-05-06 Chromosome detection
PCT/GB2017/051273 WO2017191477A1 (en) 2016-05-06 2017-05-08 Detection of chromosome interaction relevant to breast cancer

Publications (2)

Publication Number Publication Date
JP2019521701A JP2019521701A (en) 2019-08-08
JP7005596B2 true JP7005596B2 (en) 2022-03-03

Family

ID=56297311

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019510481A Active JP7005596B2 (en) 2016-05-06 2017-05-08 Detection of chromosomal interactions associated with breast cancer

Country Status (13)

Country Link
US (1) US11746378B2 (en)
EP (1) EP3452612B1 (en)
JP (1) JP7005596B2 (en)
KR (1) KR102453393B1 (en)
CN (1) CN109661477B (en)
AU (1) AU2017261442B2 (en)
CA (1) CA3023156A1 (en)
GB (1) GB201608000D0 (en)
MY (1) MY195357A (en)
PL (1) PL3452612T3 (en)
SG (1) SG11201809413RA (en)
WO (1) WO2017191477A1 (en)
ZA (1) ZA201806917B (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3510152A4 (en) 2016-09-07 2020-04-29 Flagship Pioneering, Inc. Methods and compositions for modulating gene expression
AU2017367245B2 (en) 2016-12-01 2020-09-24 Oxford BioDynamics PLC Application of epigenetic chromsomal interactions in cancer diagnostics
ES2949801T3 (en) 2017-01-09 2023-10-03 Whitehead Inst Biomedical Res Methods to alter gene expression by perturbation of transcription factor multimers that structure regulatory loops
CN114026644A (en) * 2019-03-28 2022-02-08 相位基因组学公司 Systems and methods for karyotyping by sequencing
JP2022548399A (en) 2019-09-23 2022-11-18 オメガ セラピューティクス, インコーポレイテッド Compositions and methods for modulating hepatocyte nuclear factor 4-alpha (HNF4α) gene expression
CN111334508B (en) * 2020-03-11 2022-04-15 潍坊医学院 Gene and expression vector for inhibiting proliferation, invasion and transfer of breast cancer cells
CN111798919B (en) * 2020-06-24 2022-11-25 上海交通大学 Tumor neoantigen prediction method, prediction device and storage medium
CN113436741B (en) * 2021-07-16 2023-02-28 四川大学华西医院 Lung cancer recurrence prediction method based on tissue specific enhancer region DNA methylation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500031A (en) 2005-07-04 2009-01-08 エラスムス ユニバーシティ メディカル センター Chromosome conformation capture-on-chip (4C) assay
JP2011521633A (en) 2008-06-02 2011-07-28 オックスフォード バイオダイナミックス リミテッド Methods for detecting long-range chromosomal interactions
WO2012159025A2 (en) 2011-05-18 2012-11-22 Life Technologies Corporation Chromosome conformation analysis
JP2013530709A (en) 2010-07-09 2013-08-01 セルゲンティス ビー.ブイ. Target 3-D genome region sequencing strategy

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0417740D0 (en) * 2004-08-10 2004-09-08 Uc3 Methods and kit for the prognosis of breast cancer
US20090299640A1 (en) 2005-11-23 2009-12-03 University Of Utah Research Foundation Methods and Compositions Involving Intrinsic Genes
GB0603251D0 (en) 2006-02-17 2006-03-29 Isis Innovation DNA conformation
WO2013075059A1 (en) 2011-11-18 2013-05-23 Vanderbilt University Markers of triple-negative breast cancer and uses thereof
JP6164689B2 (en) * 2013-08-30 2017-07-19 国立大学法人大阪大学 Diagnosis assistance method and determination apparatus for sensitivity to breast cancer preoperative chemotherapy
GB201320351D0 (en) * 2013-11-18 2014-01-01 Erasmus Universiteit Medisch Ct Method
SG10201807838SA (en) 2014-03-11 2018-10-30 Council Queensland Inst Medical Res Determining cancer aggressiveness, prognosis and responsiveness to treatment
WO2016207647A1 (en) * 2015-06-24 2016-12-29 Oxford Biodynamics Limited Epigenetic chromosome interactions

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500031A (en) 2005-07-04 2009-01-08 エラスムス ユニバーシティ メディカル センター Chromosome conformation capture-on-chip (4C) assay
JP2011521633A (en) 2008-06-02 2011-07-28 オックスフォード バイオダイナミックス リミテッド Methods for detecting long-range chromosomal interactions
JP2013530709A (en) 2010-07-09 2013-08-01 セルゲンティス ビー.ブイ. Target 3-D genome region sequencing strategy
WO2012159025A2 (en) 2011-05-18 2012-11-22 Life Technologies Corporation Chromosome conformation analysis

Also Published As

Publication number Publication date
KR102453393B1 (en) 2022-10-11
US11746378B2 (en) 2023-09-05
EP3452612C0 (en) 2023-08-23
MY195357A (en) 2023-01-16
AU2017261442B2 (en) 2020-05-21
SG11201809413RA (en) 2018-11-29
AU2017261442A1 (en) 2018-11-22
PL3452612T3 (en) 2023-12-11
CA3023156A1 (en) 2017-11-09
JP2019521701A (en) 2019-08-08
CN109661477A (en) 2019-04-19
WO2017191477A1 (en) 2017-11-09
ZA201806917B (en) 2022-06-29
EP3452612A1 (en) 2019-03-13
GB201608000D0 (en) 2016-06-22
EP3452612B1 (en) 2023-08-23
US20190241964A1 (en) 2019-08-08
KR20190025814A (en) 2019-03-12
CN109661477B (en) 2022-12-02

Similar Documents

Publication Publication Date Title
JP7005596B2 (en) Detection of chromosomal interactions associated with breast cancer
JP2022544604A (en) Systems and methods for detecting cellular pathway dysregulation in cancer specimens
CN111344415B (en) Biomarkers
JP2023082157A (en) gene regulation
TW202242135A (en) Analysis method
AU2020344206B2 (en) Diagnostic chromosome marker
KR20230025895A (en) Multimodal analysis of circulating tumor nucleic acid molecules
EP3548633B1 (en) Application of epigenetic chromsomal interactions in cancer diagnostics
JP7045086B2 (en) Classification method
JPWO2019069067A5 (en)
US12006547B2 (en) Detection of chromosome interactions as indicative of amyotrophic lateral sclerosis
KR102156699B1 (en) Composition for determining Soeumin
KR20240006020A (en) Chromosome interaction marker
JP2023545364A (en) disease marker
KR20220007132A (en) Chromosomal morphological markers of prostate cancer and lymphoma
CN117580962A (en) Methods and systems for detecting kidney disease or damage by gene expression analysis
CN117795098A (en) Chromosome interaction markers
JPWO2020225551A5 (en)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200407

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210312

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210611

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210811

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220105

R150 Certificate of patent or registration of utility model

Ref document number: 7005596

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150