CN102549165A - 用于乳腺肿瘤子分类的方法 - Google Patents

用于乳腺肿瘤子分类的方法 Download PDF

Info

Publication number
CN102549165A
CN102549165A CN2010800052379A CN201080005237A CN102549165A CN 102549165 A CN102549165 A CN 102549165A CN 2010800052379 A CN2010800052379 A CN 2010800052379A CN 201080005237 A CN201080005237 A CN 201080005237A CN 102549165 A CN102549165 A CN 102549165A
Authority
CN
China
Prior art keywords
character subset
sequence
seq
experimenter
methylation state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010800052379A
Other languages
English (en)
Inventor
S.卡马拉卡兰
A.贾尼夫斯基
J.B.希克斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Cold Spring Harbor Laboratory
Original Assignee
Koninklijke Philips Electronics NV
Cold Spring Harbor Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV, Cold Spring Harbor Laboratory filed Critical Koninklijke Philips Electronics NV
Publication of CN102549165A publication Critical patent/CN102549165A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/14Heterocyclic carbon compound [i.e., O, S, N, Se, Te, as only ring hetero atom]
    • Y10T436/142222Hetero-O [e.g., ascorbic acid, etc.]
    • Y10T436/143333Saccharide [e.g., DNA, etc.]

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

提供了用于分析乳腺癌病症的方法,其包括测定一个或多个CpG二核苷酸的基因组甲基化状态。此外,提供了贮存于计算机可读介质上的计算机程序产物,其包括当在数据处理装置上执行时适合于执行方法步骤的软件代码。还提供了用于支持临床医生的包括工具的设备。

Description

用于乳腺肿瘤子分类的方法
发明领域
总的来说,本发明涉及生物学和生物信息学领域。更具体而言,本发明涉及癌症肿瘤分类领域且甚至更加具体地涉及鉴定甲基化位点,这可以帮助癌症肿瘤的分类。
发明背景
在全世界范围,乳腺癌是癌症死亡的第五大最常见原因,在肺癌、胃癌、肝癌和结肠癌之后。在女性中,乳腺癌是最常见的癌症并且是癌症死亡的最常见原因。
乳腺癌通过外科手术取出的乳腺组织的病理学检查加以诊断。在诊断后,重要的是分析肿瘤类型,以在选择正确治疗时帮助临床医生。在本领域内,此种分析根据2个种类进行。
第一个种类涉及免疫组织病理学变量的使用,例如肿瘤大小、ER/PR状态、***阴性等,以限定临床预后指数例如诺丁汉预后指数(Nottingham Prognostic Index)(NPI)。关于此种指数的问题是它已显示是非常保守的,因此一般导致患者接受侵入性治疗(aggressive therapy),即使当他们具有疾病复发的低危险时。
第二个种类涉及一般约500种的大量基因的表达水平测量,并且基于基因的相对表达水平计算亚型的概率。这种方法就组织处理要求而言是非常昂贵的。它还难以在临床背景中进行,这是由于实验室设备的需求。
DNA甲基化,可以被遗传且随后去除而不改变原始DNA序列的一类DNA化学修饰,是最充分研究的基因调节的外遗传(epigenetic)机制。在DNA中存在其中胞嘧啶核苷酸在碱基的线性序列中紧接于鸟嘌呤核苷酸出现的区域,称为CpG岛。
CpG岛在正常细胞中一般是重甲基化的。然而,在肿瘤发生过程中,在这些岛上发生甲基化不足,这可以导致特定重复的表达。这些甲基化不足事件还与一些癌症的严重性关联。在特定情况下,其可能在病理学例如癌症、印记、发育、组织特异性或X染色体失活中出现,基因相关的岛可以是重甲基化的。具体地,在癌症中,接近于肿瘤阻抑基因的岛的甲基化是频繁事件,通常在第二个等位基因通过缺失丧失(杂合性丢失,LOH)时出现。伴随甲基化岛通常可见的一些肿瘤阻抑基因是p16、Rassf1a和BRCA1。
存在关于结肠直肠癌和***癌的报道的外遗传标记。例如,Epigenomics AG(Berlin,德国)具有Septin 9作为关于血浆中的结肠直肠癌筛选的标记。关于使用甲基化位点来预测癌症中的差异治疗应答且推荐合适治疗的方法已公开于US20050021240A1中。然而,由这种方法预测的结果是有限的,因为它们不能直接应用于临床实践中。因此,具有用于分析乳腺癌病症的方法将是有利的,所述方法是时间有效、可靠和节省成本的。
发明概述
因此,本发明优选寻求减轻、缓和或消除个别地或以任何组合的一种或多种本领域中上文鉴定的缺陷和缺点,并且通过提供根据附加专利权利要求用于分析乳腺癌病症的方法解决了至少上述问题。
根据一个方面,公开了用于分析乳腺癌病症的方法。该方法包括测定选自由SEQ ID NO. 1至SEQ ID NO. 600组成的序列组的序列中一个或多个CpG二核苷酸的基因组甲基化状态。该方法提供了使用甲基化模式表征癌症肿瘤的改善的能力。
序列SEQ ID NO. 1至SEQ ID NO. 600的目的区域在表1中指定(作为各个“染色体”上的“起始”和“终止”)。
这个方面呈现了超过现有技术发展水平的改善,这是因为它使得乳腺细胞增生性病症的高度特异性分类成为可能。
在一个方面,公开了计算机程序产物。计算机程序产物贮存于计算机可读介质上,其包括当在数据处理装置上执行时适合于执行根据一个方面的方法步骤的软件代码。
在一个方面,公开了设备。该设备包括适合于执行根据一些实施方案的方法的工具。关于这个的优点是支持临床医生。
此处,请求保护的序列还包含这样的序列,其为关于指定序列的反向互补体。
附图简述
本发明能够具有的这些和其他方面、特征和优点参考附图根据本发明的实施方案的下述描述将是显而易见的且由其阐明,其中
图1                是根据一些实施方案的方法的示意性举例说明;
图2                是5次测量1 – 5的数据集20的示意性举例说明;
图3                是5次测量1 – 5的第一个子集30的示意性举例说明;
图4                是5次测量1 – 5的第二个子集40的示意性举例说明;和
图5                是聚类51、52、53的举例说明,其中图5A是第一个聚类51,图5B是第二个聚类52,并且图5C是第三个聚类53。
图6                是根据一个实施方案的计算机程序产物的示意性举例说明。
图7                是根据一个实施方案的设备的示意性举例说明。
实施方案详述
下文将参考附图更详细地描述本发明的几个实施方案,以使本领域技术人员能够执行本发明。然而,本发明可以以许多不同形式体现,并且不应解释为限制于本文描述的实施方案。相反,这些实施方案这样提供,从而使得公开内容将是彻底且完全的,并且将本发明的范围全面传达给本领域技术人员。实施方案不限制本发明,但本发明仅受附加专利权利要求限制。此外,在附图中举例说明的具体实施方案的详述中使用的术语不意欲是本发明的限制。
根据一些实施方案的想法是使用DNA序列的小选择以分析乳腺癌病症的方法。分析通过测定在本文公开的序列中或其反向互补体中一个或多个CpG二核苷酸的基因组甲基化状态来完成。
惊讶地发现一些DNA序列SEQ ID NO:1至SEQ ID NO:600充当外遗传标记,其可以用于通过使肿瘤再分型(subtyping)来分析乳腺癌。在现有技术中,可能基于基因表达使乳腺癌再分型。已报道了5个不同亚型;腔A型、腔B型、基底型、ERBB2超表达型和正常样型。本发明人已使用DNA甲基化鉴定了相同亚型。
DNA SEQ ID NO:1至SEQ ID NO:600通过跨越一组83种乳腺肿瘤,就甲基化分析150 000个个别基因组基因座进行鉴定。关于肿瘤样品的临床信息的可用性允许在乳腺癌亚型、组织学和肿瘤侵袭性的背景中研究DNA甲基化。鉴定了5个主要乳腺癌分子亚型(腔A和B型、基底型、ERBB2超表达型和正常样型)。首先,执行关于使用甲基化的肿瘤组的无监督聚类是否重现主要腔和基底类别的研究,所述主要腔和基底类别通过表达分析进行鉴定。过滤标准用于鉴定在聚类中使用的特征。这个标准是在83个肿瘤样品中变化最大的前500个基因座。随后,添加使肿瘤与正常组织区分的前100个基因座。在表1展示的这600个特征用于聚类对于其可获得表达亚型数据的83种肿瘤。用基于这600个基因座的样品的Pearson相关和完全连锁的等级聚类给出树形图,这令人惊讶地类似于通过表达分析产生的那种。
表1. 用于分类癌症的600个特征
Figure 973126DEST_PATH_IMAGE001
Figure 890266DEST_PATH_IMAGE002
Figure 670003DEST_PATH_IMAGE003
Figure 986584DEST_PATH_IMAGE004
Figure 800956DEST_PATH_IMAGE005
Figure 826681DEST_PATH_IMAGE006
Figure 479565DEST_PATH_IMAGE008
Figure 148444DEST_PATH_IMAGE009
Figure 63179DEST_PATH_IMAGE010
Figure 817509DEST_PATH_IMAGE011
Figure 757783DEST_PATH_IMAGE012
Figure 281168DEST_PATH_IMAGE013
Figure 648695DEST_PATH_IMAGE014
在一个实施方案中,根据图1,提供了方法10。所述方法10包括选择100特征子集,其包括根据SEQ ID NO. 1至SEQ ID NO. 600来自甲基化分类列表的至少一个位置(post)。
选择100特征子集可以基于用Pearson相关和完全连锁的等级聚类来执行,以表征每个特征子集的适合性,对于每个样品(si,i=1..M)给出N个值的向量mi形式的甲基化特征数据集,其中mi,j提供了关于第i种样品和第j种探针的甲基化状态。一般地,测量的信号的一些统计学分析将产生一组探针(特征),以输入至上文的等级聚类方法。
特征子集选择100使用遗传算法(Genetic Algorithm)(GA),这基于适合性函数反复评价特征子集,所述适合性函数以一定方式表征特征子集的一些性质。在一个实施方案中,用Pearson相关和完全连锁的等级聚类用作适合性函数,以评估特征子集如何良好。
下述实施例用于举例说明原理。
图2显示测量的数据集20用8个特征进行表征,所述测量在这种情况下为5个样品,其显示为1 – 5,所述特征显示为字母A到H。图3和4显示通过从数据集中选择行(特征)由测量数据集生成的2个特征子集。图3显示具有显示为1 – 5的5个样品但仅4个特征的第一个特征子集30。图4显示具有显示为1 – 5的5个样品但仅6个特征的第二个子集40。
接下来,可以执行聚类。图5显示当实施用Pearson相关和完全连锁的等级聚类时,基于来自图2到4的数据集的聚类或树形图。图5A显示基于总数据集20的第一个聚类51。图5B显示基于第一个特征子集30的第二个聚类52,并且图5C显示基于第二个特征子集40的第三个聚类53。
在已聚类数据集后,执行所有聚类结果的分级。在一个实施方案中,聚类分析方法用于分级。例如,可能基于其有效性例如按照聚类内聚性或分离表征且分级个别聚类。这可以以本领域技术人员众所周知的多种方法之一完成。因此,可能基于当用于聚类样品时它们生成的聚类质量分级2个或更多个特征子集。
在另一个实施方案中,样品的一些性质(例如基于病理学的癌症亚型)用于分级。根据这个性质,相同或相关亚型集合在一起。例如,如果来自图2到4的5个样品分别具有与之相关的下述亚型标记{1=X,2=X,3=Y,4=Y,5=X},那么这随后将对于图5中所示的3个聚类产生下述标记分组:A:{XXY,YX};B:{XY,YXX};C:{XXX,YY}。在这种情况下,与第一个特征子集30或基于整个数据集20的聚类相比较,通过图5C表示的第二个子集40明显更好,这是因为它将亚型正确聚类在一起。
在一个实施方案中,基于聚类比较2个聚类输出D1和D2。首先,基于通过聚类产生的树形图获得N个(C1,C2,… CN)聚类。随后,基于聚类计算性质,例如轮廓宽度(silhouette width)– SIL(Ci)的普遍方法。现在通过下式获得聚类的单数字(single-number)特征:
AVGSIL(D)=(SUM[i=1..N] SIL(Ci))/N
通过比较AVGSIL(D1)和AVGSIL(D2),可以确定哪个聚类是优选的。在另一个实施方案中,构建数据结构G以具有维数N x L的矩阵形式构建,其中L是对于样品可获得的不同标记的数目。对于标记{X. Y},L = 2,或对于标记{正常、侵袭性癌症、非侵袭性癌症},L = 3。随后对于每个聚类i(i=1..N),对于来自G的每个元素gij,L值以下述方式获得:
gij = count(聚类i中且具有标记j的样品)
现在,可能计算每个聚类Ci的均匀度:
UNIFORMITY(Ci)= max(在G中在行i中的计数)/sum(在G中在行i中的计数)
最后,聚类由下述表征为聚类的单数字特征:
AVGUNIFORMITY(D)= SUM[i=1..N](UNIFORMITY(Ci))/N
通过比较AVGUNIFORMITY(D1)和AVGUNIFORMITY(D2),可以确定哪个聚类是优选的。
这个选择过程的迭代重复逐渐改善通过GA发现的特征子集的聚类质量。在多次重复后,所有评价的特征子集可以基于其在GA执行过程中的表现进一步过滤。在一个实施方案中,特征子集通过临床样品层化中的平均聚类表现进行分选。在另一个实施方案中,除平均表现外,特征子集基于其持续重新评价进行过滤。换言之,重复选择用于进一步评价的特征子集优于仅在少数迭代后从考虑中淘汰的特征子集。GA特征子集选择的最终输出是用不同起始条件运行多种情况,并且合并来自这些情况的每一种的过滤的特征子集。来自一个此种评价的特征子集在表3A中列出。此外,可以获得GA运行集合的累积特征,并且用于生成聚集子集的单个集合中的特征子集的特征子集。在一个实施方案中,计数特征子集中的每个特征的出现,并且获得总直方图,从而给出600个特征的每一个的利用度。基于这个信息,并且例如在一个实施方案中,600个特征的成对出现频率用于构建特征子集,其在子集的单个集合中概括GA运行,所谓的趋势模式。表3B提供了长度45和60的此种特征子集。
特征子集的例子在表2、3A和3B中提供。因此,在一个实施方案中,特征子集包括根据表2中列出的选择之一的CpG二核苷酸。
表2. 特征子集。每个子集包括通过与表1中FragID:s对应的编号指出的序列选择。
Figure 165444DEST_PATH_IMAGE016
Figure 744935DEST_PATH_IMAGE017
在一个实施方案中,特征子集包括根据表3A中列出的选择之一的CpG二核苷酸。
表3A. 特征子集。每个子集包括通过与表1中FragID:s对应的编号指出的序列选择。
Figure 80102DEST_PATH_IMAGE018
在一个实施方案中,特征子集包括根据表3B中列出的选择之一的CpG二核苷酸。
表3B. 特征子集。每个子集包括通过与表1中FragID:s对应的编号指出的序列选择。
Figure 12286DEST_PATH_IMAGE019
在一个实施方案中,方法10包括测定120选自与标记实验对象组对应的序列组的序列中一个或多个CpG二核苷酸的甲基化状态,从而导致甲基化分类列表。存在用于测定120受试者的DNA分子的甲基化状态的众多方法,与特征子集对应。DNA可以通过本领域技术人员已知用于纯化DNA的任何方法获得。在一个实施方案中,甲基化状态借助于选自下述的一种或多种方法进行测定110:亚硫酸氢盐测序、焦磷酸测序(pyrosequencing)、甲基化敏感单链构象分析(MS-SSCA)、高分辨率解链分析(HRM)、甲基化敏感单核苷酸引物延伸(MS-SnuPE)、碱基特异性切割/MALDI-TOF、甲基化特异性PCR(MSP)、基于微阵列的方法、msp I切割。
在一个实施方案中,方法10还包括在统计学上分析120甲基化分类列表,从而获得受试者的乳腺癌种类。这可以通过共同聚类来自临床研究的受试者甲基化数据和样品完成。所得到的聚类随后分成N个组(例如通过将聚类树形图切割成N个子树)。包含受试者的子树就研究样品中存在的乳腺癌种类进行评价,并且受试者样品指定子树中的大多数样品种类。
在一个实施方案中,方法10进一步包括将受试者分类(130)为属于乳腺癌的5个主要亚型之一。
在一个实施方案中,根据图6,提供了计算机程序产物60。计算机程序产物60贮存于计算机可读介质上,其包括当通过具有计算机处理性质的装置执行时排列的第一个61、第二个62、第三个63和第四个64代码段,用于执行在一些实施方案中限定的所有方法步骤。
在一个实施方案中,根据图7,提供了用于支持临床医生的设备70。所述设备包括用于选择700特征子集的工具,其包括根据SEQ ID NO. 1至SEQ ID NO. 600来自甲基化分类列表的至少一个位置。此外,设备70包括用于测定710受试者的DNA中一个或多个CpG二核苷酸的甲基化状态的工具,与特征子集对应。此外,设备70包括用于在统计学上分析720甲基化分类列表的工具,从而获得受试者的乳腺癌种类。此外,设备70包括用于将受试者分类730为属于乳腺癌的5个主要亚型之一的工具。所述工具700、710、720、730可以彼此可操作地连接。
本发明可以以任何合适形式实现,包括硬件、软件、固件或这些的任何组合。然而,优选地,本发明作为在一个或多个数据处理器和/或数字信号处理器上运行的计算机软件实现。本发明的一个实施方案的元件和组分可以以任何合适方式在物理上、功能上和逻辑上实现。事实上,功能性可以在单个单元中、在多个单元中或作为其他功能单元的部分实现。因此,本发明可以在单个单元中实现,或可以在物理上和功能上分布在不同单元和处理器之间。
尽管本发明已在上文参考具体实施方案进行描述,但它不预期限制于本文阐述的具体形式。相反,本发明仅受附加权利要求限制,并且除上文指定外的其他实施方案同样可能在这些附加权利要求的范围内。
在权利要求中,术语“包括”不排除其他元件或步骤的存在。此外,尽管个别列出,但多个工具、元件或方法步骤可以通过例如单个单元或处理器实现。此外,尽管个别特征可以包括在不同权利要求中,但这些可能有利地组合,并且在不同权利要求中的包括不暗示特征的组合不是可行的和/或不是有利的。此外,单数参考不排除复数。术语“a”、“an”、“第一”、“第二”等不排除复数。在权利要求中的参考记号仅作为阐明实施例提供,并且不应解释为以任何方式限制权利要求的范围。
参考记号列表:
10     方法
100    选择步骤
110    测定步骤
120    分析步骤
130    分类步骤
20      数据集
30     第一个特征子集
40     第二个特征子集
51     第一个聚类
52     第二个聚类
53     第三个聚类
60      计算机程序产物
61      第一个代码段
62      第二个代码段
63      第三个代码段
64      第四个代码段
70      设备
700    选择工具 
710    测定工具
720    分析工具
730    分类工具 
1至5  样品编号

Claims (13)

1.用于分析乳腺癌病症的方法(10),其包括测定选自由SEQ ID NO. 1至SEQ ID NO. 600组成的序列组的序列中一个或多个CpG二核苷酸的基因组甲基化状态。
2.根据权利要求1的方法,其中所述分析是受试者中的乳腺癌分类,并且其中执行下述步骤,
a. 选择(100)特征子集,其包括根据SEQ ID NO. 1至SEQ ID NO. 600来自甲基化分类列表的至少一个位置;
b. 测定(110)受试者的DNA中一个或多个CpG二核苷酸的甲基化状态,与特征子集对应;和
c. 在统计学上分析(120)所述甲基化分类列表,从而获得所述受试者的乳腺癌种类。
3.根据权利要求1或2的方法,其中另外执行下述步骤,
d. 将所述受试者分类(130)为属于乳腺癌的5个主要亚型之一。
4.根据权利要求1 – 3的方法,其中所述甲基化状态对于序列亚组进行测定(110),其中所述特异性亚组选自表2、3A或3B。
5.根据权利要求1 – 3的方法,其中所述甲基化状态对于序列亚组进行测定(110),所述序列亚组通过选择(100)特征子集进行测定。
6.根据权利要求5的方法,其中所述特征子集选择(100)是具有等级聚类的遗传算法。
7.根据权利要求1 – 3的方法,其中所述甲基化状态对于序列亚组进行测定(110),所述序列亚组通过特征子集选择(100)的输出概括进行测定。
8.根据权利要求7的方法,其中所述特征子集选择(100)的输出概括是特征子集中每个特征的出现和选自由SEQ ID NO. 1至SEQ ID NO. 600组成的序列组的序列的成对出现的计数。
9.根据权利要求8的方法,其中特征子集中每个特征的出现和序列的成对出现的计数具有大小45。
10.根据权利要求8的方法,其中特征子集中每个特征的出现和序列的成对出现的计数具有大小60。
11.根据权利要求1 – 4的方法,其中所述甲基化状态借助于选自下述的一种或多种方法进行测定(110),
a. 亚硫酸氢盐测序
b. 焦磷酸测序
c. 甲基化敏感单链构象分析(MS-SSCA)
d. 高分辨率解链分析(HRM)
e. 甲基化敏感单核苷酸引物延伸(MS-SnuPE)
f. 碱基特异性切割/MALDI-TOF
g. 甲基化特异性PCR(MSP)
h. 基于微阵列的方法和
i. msp I切割。
12.一种贮存于计算机可读介质上的计算机程序产物(60),其包括当在数据处理装置上执行时适合于执行根据权利要求2、3、4或7的方法步骤的软件代码。
13.一种用于支持临床医生的设备(70),所述设备包括用于下述的工具
a. 选择(700)特征子集,其包括根据SEQ ID NO. 1至SEQ ID NO. 600来自甲基化分类列表的至少一个位置;
b. 测定(710)受试者的DNA中一个或多个CpG二核苷酸的甲基化状态,与特征子集对应;
c. 在统计学上分析(720)所述甲基化分类列表,从而获得所述受试者的乳腺癌分类;和
d. 将所述受试者分类(730)为属于乳腺癌的5个主要亚型之一,
所述工具彼此可操作地连接。
CN2010800052379A 2009-01-30 2010-01-25 用于乳腺肿瘤子分类的方法 Pending CN102549165A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14841309P 2009-01-30 2009-01-30
US61/148413 2009-01-30
PCT/IB2010/050316 WO2010086782A2 (en) 2009-01-30 2010-01-25 Methods for the subclassification of breast tumours

Publications (1)

Publication Number Publication Date
CN102549165A true CN102549165A (zh) 2012-07-04

Family

ID=42224291

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010800052379A Pending CN102549165A (zh) 2009-01-30 2010-01-25 用于乳腺肿瘤子分类的方法

Country Status (8)

Country Link
US (1) US20120004118A1 (zh)
EP (2) EP2955235A3 (zh)
JP (1) JP2012517215A (zh)
KR (1) KR20110113642A (zh)
CN (1) CN102549165A (zh)
BR (1) BRPI1005306A2 (zh)
RU (1) RU2011135955A (zh)
WO (1) WO2010086782A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110229913A (zh) * 2019-07-19 2019-09-13 上海奕谱生物科技有限公司 基于甲基化水平检测肿瘤的广谱性标记物及其应用
CN116121371A (zh) * 2022-07-06 2023-05-16 武汉艾米森生命科技有限公司 检测tlx1基因中目标区域的甲基化水平的试剂在制备食管癌诊断产品中的应用

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6054750B2 (ja) * 2011-01-28 2016-12-27 国立研究開発法人国立がん研究センター 肝細胞癌のリスク評価方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005123945A2 (en) * 2004-06-21 2005-12-29 Epigenomics Ag Epigenetic markers for the treatment of breast cancer
WO2006008128A2 (en) * 2004-07-18 2006-01-26 Epigenomics Ag Epigenetic methods and nucleic acids for the detection of breast cell proliferative disorders
WO2007019670A1 (en) * 2005-07-01 2007-02-22 Graham, Robert Method and nucleic acids for the improved treatment of breast cancers

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8076063B2 (en) * 2000-02-07 2011-12-13 Illumina, Inc. Multiplexed methylation detection methods
US20050021240A1 (en) 2000-11-02 2005-01-27 Epigenomics Ag Systems, methods and computer program products for guiding selection of a therapeutic treatment regimen based on the methylation status of the DNA
EP1364069B1 (en) * 2001-03-01 2009-04-22 Epigenomics AG Method for the development of gene panels for diagnostic and therapeutic purposes based on the expression and methylatoin status of the genes
JP2004033210A (ja) * 2002-02-20 2004-02-05 Ncc Technology Ventures Pte Ltd 癌診断に関する物および方法
US7991557B2 (en) * 2004-06-19 2011-08-02 Genenews Corporation Computer system and methods for constructing biological classifiers and uses thereof
CA2612021A1 (en) * 2005-06-13 2006-12-28 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
WO2007026960A1 (ja) * 2005-08-31 2007-03-08 Link Genomics, Inc. Mocs3遺伝子の治療的又は診断的用途
AU2007254983A1 (en) * 2006-05-31 2007-12-13 Orion Genomics Llc Gene methylation in cancer diagnosis
RU2449365C2 (ru) * 2006-08-11 2012-04-27 Конинклейке Филипс Электроникс, Н.В. Способы и устройство для интегрирования систематического прореживания данных в основанный на генетическом алгоритме выбор подмножества признаков
US20090018031A1 (en) * 2006-12-07 2009-01-15 Switchgear Genomics Transcriptional regulatory elements of biological pathways tools, and methods
US20090203011A1 (en) * 2007-01-19 2009-08-13 Epigenomics Ag Methods and nucleic acids for analyses of cell proliferative disorders
WO2009037635A2 (en) * 2007-09-17 2009-03-26 Koninklijke Philips Electronics N. V. Method for the analysis of breast cancer disorders
WO2009138909A1 (en) * 2008-05-12 2009-11-19 Koninklijke Philips Electronics N.V. A medical analysis system
CN102257161A (zh) * 2008-12-18 2011-11-23 皇家飞利浦电子股份有限公司 用于检测dna甲基化模式的方法
US20120004855A1 (en) * 2008-12-23 2012-01-05 Koninklijke Philips Electronics N.V. Methylation biomarkers for predicting relapse free survival
CN102666876B (zh) * 2009-09-22 2015-11-25 皇家飞利浦电子股份有限公司 用于辅助诊断和/或监测乳腺癌进展的方法和组合物

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005123945A2 (en) * 2004-06-21 2005-12-29 Epigenomics Ag Epigenetic markers for the treatment of breast cancer
WO2006008128A2 (en) * 2004-07-18 2006-01-26 Epigenomics Ag Epigenetic methods and nucleic acids for the detection of breast cell proliferative disorders
WO2007019670A1 (en) * 2005-07-01 2007-02-22 Graham, Robert Method and nucleic acids for the improved treatment of breast cancers

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110229913A (zh) * 2019-07-19 2019-09-13 上海奕谱生物科技有限公司 基于甲基化水平检测肿瘤的广谱性标记物及其应用
CN110229913B (zh) * 2019-07-19 2022-10-11 上海奕谱生物科技有限公司 基于甲基化水平检测肿瘤的广谱性标记物及其应用
CN116121371A (zh) * 2022-07-06 2023-05-16 武汉艾米森生命科技有限公司 检测tlx1基因中目标区域的甲基化水平的试剂在制备食管癌诊断产品中的应用

Also Published As

Publication number Publication date
EP2391735A2 (en) 2011-12-07
BRPI1005306A2 (pt) 2019-03-19
US20120004118A1 (en) 2012-01-05
EP2955235A3 (en) 2016-03-02
EP2955235A2 (en) 2015-12-16
KR20110113642A (ko) 2011-10-17
WO2010086782A2 (en) 2010-08-05
JP2012517215A (ja) 2012-08-02
WO2010086782A8 (en) 2011-12-08
RU2011135955A (ru) 2013-03-10
WO2010086782A3 (en) 2010-11-25

Similar Documents

Publication Publication Date Title
US8554488B2 (en) Determining a probabilistic diagnosis of autism by analysis of genomic copy number variations
WO2020154682A2 (en) Detecting cancer, cancer tissue of origin, and/or a cancer cell type
AU2019249422A1 (en) Methylation markers and targeted methylation probe panels
CN102666876B (zh) 用于辅助诊断和/或监测乳腺癌进展的方法和组合物
JP2022514879A (ja) 無細胞dna末端特性
JP2014519319A (ja) エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物
WO2020163403A1 (en) Detecting cancer, cancer tissue of origin, and/or a cancer cell type
CN114868191A (zh) 利用起源组织阈值的癌症分类
CN102549165A (zh) 用于乳腺肿瘤子分类的方法
CN102348809B (zh) 用于预测无复发存活的生物学标记物
de Ridder et al. Purity for clarity: the need for purification of tumor cells in DNA microarray studies
EP2917367A1 (en) A method of improving microarray performance by strand elimination
CN107119144B (zh) 多功能转录调控因子ctcf的dna结合位点ctcf_55的应用
JP2012517215A5 (zh)
CN107151708B (zh) 多功能转录调控因子ctcf的dna结合位点ctcf_13的应用
EP4234720A1 (en) Epigenetic biomarkers for the diagnosis of thyroid cancer
Zheng et al. DNA methylation profiling distinguishes three clusters of breast cancer cell lines
CN107227366A (zh) 多功能转录调控因子ctcf的dna结合位点ctcf_113的应用
Pennington et al. Cancer phylogenetics from single-cell assays
CN107164532B (zh) 多功能转录调控因子ctcf的dna结合位点ctcf_94的应用
Chaffanet et al. Integrated genomic analysis of breast cancers
Khalid et al. Microarrays: Rise of Novel Technology
Simoes et al. SAM method as an approach to select candidates for human prostate cancer markers
Singh Tunable Biclustering Algorithm for Analyzing Large Gene Expression Data Sets
Wang et al. Heritable Clustering Algorithms for Recapturing Epigenetic Progression in Breast Cancer

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120704