CN114514329A - 治疗或预防方法 - Google Patents

治疗或预防方法 Download PDF

Info

Publication number
CN114514329A
CN114514329A CN202080055551.1A CN202080055551A CN114514329A CN 114514329 A CN114514329 A CN 114514329A CN 202080055551 A CN202080055551 A CN 202080055551A CN 114514329 A CN114514329 A CN 114514329A
Authority
CN
China
Prior art keywords
variants
annotation
disorder
complex
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080055551.1A
Other languages
English (en)
Inventor
M·凯恩斯
W·雷伊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Newcastle University of Upon Tyne
Original Assignee
Newcastle University of Upon Tyne
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2019901861A external-priority patent/AU2019901861A0/en
Application filed by Newcastle University of Upon Tyne filed Critical Newcastle University of Upon Tyne
Publication of CN114514329A publication Critical patent/CN114514329A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/10Ontologies; Annotations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K45/00Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/18Antipsychotics, i.e. neuroleptics; Drugs for mania or schizophrenia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/24Antidepressants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/08Drugs for disorders of the metabolism for glucose homeostasis
    • A61P3/10Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Physiology (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文公开了治疗人类受试者的复杂病症和预防处于发展病症的风险中的人类受试者的复杂病症的方法,包括鉴定与复杂病症相关的一种或多种药理学相关生物学途径和选择适合于治疗或预防所述复杂病症的药剂。如本文所述,已知药物标靶的生物学途径中共同变体富集的量化提供了功能上注释全基因组多基因风险得分的手段,该得分提供了个体暴露于风险变体的指示,这些变体可能使用存在的药剂、膳食补充剂或生活方式干预进行处理。

Description

治疗或预防方法
技术领域
本公开一般来说涉及用于治疗或预防人类受试者的复杂病症的方法,包括鉴定与该病症相关的一种或多种药理学相关的生物学途径和选择适用于治疗或预防受试者的所述复杂病症的药剂。
背景技术
疾病的显著负担是由复杂的性状引起的,包括精神和神经行为障碍、炎症和自身免疫病症、代谢和心血管疾病以及癌症。直到最近,难以确定这些性状的可遗传成分,然而,由协作联盟组装的大型队列的强大全基因组关联研究(GWAS)的出现揭示了对其常见变体架构的重要见解。虽然总体而言,这些信息对于绘制可能是病因学因素的基因和途径至关重要,但个体变异的小效应量(effect size)及其在人群中的异质性使得它们与患有该疾病的个体的相关性高度可变、相对特异性和相对于总变体负担来说相当次要。换句话说,个体变体作为治疗干预的相对较小的靶标存在,并且在许多病症中可能不会吸引药物开发所需的投资。因此,需要使用这种大量不同遗传信息的机制,以最大化其在治疗进展中的效用。这需要一种个性化的方法,其可以捕捉受影响个体在与现有药物一致的生物成分和/或与关键病理生理过程相关的途径方面的变异负担,从而为开发新的干预措施提供足够的支持。
总结基因组风险负担的方法,例如多基因风险评分(PRS),已证明与队列研究中的许多复杂性状显著相关,例如神经精神病症(Purcell et al.,2009,Nature,460:748-752),糖尿病(Xu et al.,2018,Nature Communications,9:2941),心血管疾病(Khera etal.,2018,Nature Genetics,50:1219-1224),和炎症性病症(Cleynen et al.,2016,TheLancet,387:156-167)。在PRS模型中,单个等位基因通过与在强大的GWAS中产生的给定表型相关的关联效应量进行加权。因此,可以通过这种方法在患者中量化常见变异的累积负担。重要的是,当以低于全基因组显著性(P<5x10-8)的严格阈值掺入变体时,PRS显示出最大的效用,即更高程度的捕获多基因性(Purcell et al.,2009,同上)。最近的分析还表明,PRS非常高的人群中的个体在许多复杂情况下的风险增加超过三倍(Khera et al.,2018,同上)。
全基因组PRS的一个关键限制是其异质风险因素的组成,这些风险因素缺乏生物显著性并且不能提供可能有助于设计精确治疗策略的特定信息。因此,一直需要开发方法以提供与全基因组PRS的生物学相关性,这能够为治疗或预防复杂病症提供可操作的结果。
发明内容
本公开部分基于令人惊讶的发现,即用已知药物靶标对生物学途径中常见变体富集的量化提供了一种对全基因组PRS进行功能注释的方法,其提供了个体暴露于风险变体的指示,这些风险变体使用现有药剂、膳食补充剂或生活方式干预是可以治疗的。这一发现已在用于治疗人类受试者的复杂病症或预防有发展复杂病症风险的人类受试者的复杂病症的方法中付诸实践。
因此,在一个方面,本公开提供了一种用于治疗人类受试者的复杂病症的方法,包括:
a.鉴定一种或多种药理学相关的生物学途径,其包括以下步骤:
i.从多个患有复杂病症的个体和多个没有复杂病症的个体获得代表全基因组变体的数据;
ii.选择与所述复杂病症显著相关的多组变体,其中每组变体使用多个P值阈值(PT)鉴定;
iii.对所述多组变体中的每一个进行基因集关联分析,以鉴定富含与所述复杂病症显著相关的变体的基因集;
iv.对于每个鉴定出的基因集,生成对应于多个预定义注释类别的多个注释,其中所述多个预定义注释类别包括生物途径注释类别、药物靶标注释类别和治疗剂注释类别;和
v.鉴定一种或多种药理学相关生物学途径,其中所述药理学相关生物学途径包括注释的生物学途径、注释的药物靶标和至少一种注释的治疗剂;
b.选择用于治疗受试者的复杂病症的治疗剂,其包括:
i.从受试者获得代表生物样品中全基因组变体的数据;
ii.使用步骤(a)(ii)中的所述多个PT的每一个,从受试者的全基因组变体数据,计算步骤(a)(v)中鉴定的所述药理学相关生物学途径的预测性多基因得分;和
iii.从所述复杂病症的治疗中选择至少一种治疗剂,其中相对于参考值升高的预测性多基因得分表明所述受试者可能对至少一种注释的治疗剂敏感,以及
c.用选择的治疗剂治疗所述受试者。
在另一个方面,本公开提供了一种用于在处于发展复杂病症风险的人类受试者中预防复杂病症的方法,包括:
a.鉴定一种或多种药理学相关的生物学途径,其包括以下步骤:
i.从多个患有复杂病症的个体和多个没有复杂病症的个体获得代表全基因组变体的数据;
ii.选择与所述复杂病症显著相关的多组变体,其中每组变体使用多个P值阈值(PT)鉴定;
iii.对所述多组变体中的每一个进行基因集关联分析,以鉴定富含与所述复杂病症显著相关的变体的基因集;
iv.对于每个鉴定出的基因集,生成对应于多个预定义注释类别的多个注释,其中所述多个预定义注释类别包括生物途径注释类别、药物靶标注释类别、治疗剂注释类别、膳食补充剂注释类别和生活方式干预注释类别;和
v.鉴定一种或多种药理学相关生物学途径,其中所述药理学相关生物学途径包括注释的生物学途径和注释的药物靶标;
b.选择治疗以预防复杂病症的发展,其包括以下步骤:
i.从受试者获得代表生物样品中全基因组变体的数据;
ii.使用步骤(a)(ii)中的所述多个PT的每一个,从受试者的全基因组变体数据,计算步骤(a)(v)中鉴定的所述药理学相关生物学途径的预测性多基因得分;和
iii.将受试者鉴定为处于发展所述复杂病症的风险中,其中相对于参考值升高的预测性多基因得分表明受试者可能处于发展所述复杂病症的风险中,其中具有相对于参考值升高的预测性多基因得分的药理学相关生物学途径具有选自治疗剂注释、膳食补充剂注释和生活方式干预注释的至少一个附加注释,以及
c.用一种或多种注释的治疗剂、膳食补充剂或生活方式干预治疗所述受试者以防止所述复杂病症的发展。
在另一方面,本公开提供了一种基于计算机的基因组注释***,其包括被配置为存储指令的非暂时性存储器和与所述存储器耦合的至少一个处理器,所述处理器被配置为:
a.从多个患有复杂病症的个体和多个没有复杂病症的个体接收全基因组变体数据;
b.处理所述全基因组变体数据以选择与所述复杂病症显著相关的多组变体,其中每组变体使用多个P值阈值(PT)鉴定;
c.对所述多组变体中的每一个进行基因集关联分析,以鉴定富含与所述复杂病症显著相关的变体的基因集;
d.对于每个鉴定出的基因集,生成对应于多个预定义注释类别的多个注释,其中所述多个预定义注释类别包括生物途径注释类别、药物靶标注释类别和批准治疗剂注释类别;和
e.鉴定一种或多种药理学相关生物学途径,其中所述药理学相关生物学途径包括注释的生物学途径、注释的药物靶标和至少一种注释的批准治疗剂;
附图说明
在此仅通过非限制性示例的方式参考附图描述了本公开的实施方案。
图1是在精准治疗和预防中实施药物富集得分(PES)的示意图。(A)使用PES框架,患有复杂病症的个体为常见变异SNP基因分型提供DNA,用于确定具有高PES的个体。PES组(热图第1-9行,用深色表示富集)本质上鉴定了针对个体生物学富集(用已知药物靶标的途径)为该途径中的多基因风险定制的精确治疗选项。(B)使用PES对人群中对具有临床可操作性的各种复杂性状具有高多基因风险的个体进行预防性干预(热图第A-I行,高PRS用深色表示)。在这种情况下,保守的预防措施可能会考虑环境风险暴露,并侧重于生活方式干预,例如饮食和运动,而不是由于副作用和/或成本而在没有症状表现的情况下可能不合理的药物治疗。
图2显示了跨病症显著相关的可操作途径中基因表达的组织和时间特异性。候选基因在(A)30种不同组织类型和(B)29个不同年龄的大脑中的表达(pcw=受孕后周数,yrs=岁)。显示了这些基因的上调、下调和差异表达的双边检验,深灰色条表示应用多次测试校正后的统计学显著性(调整后P调整后<0.05)。
图3是用于鉴定富含GWAS风险变体的药理学相关途径的方法的示意表示。
图4是包含在源自精神***症GWAS的候选PES途径中的基因的组织特异性表达的图形表示。
图5是精神***症患者和具有多个升高的药物富集得分的健康对照患者的分布的图形表示。在ASRB队列的靠前四分位数(A)或十分位数(B)中的每个途径中的PES被归类为高,并且在每个个体中计数超过此阈值的得分的数量在此处表示为每个表型队列的百分比(即,SZ或HC)。靠前四分位数或十分位数PES得分的最高数量为六(仅精神***症患者)。SZ=精神***症,HC=健康对照。
图6显示了ASRB队列中全基因组精神***症PRS与药物富集得分之间的关系。(A)每个PES和总PRS之间成对单变量相关性的图形表示。比例尺表示正向或负向的相关性强度。(B)靠前十分位数或(C)四分位数中具有多个PES的个体中内核密度(y轴)针对总PRS分布的估计(x轴)的图形表示。比例尺是指个体中超过阈值的PES数量,即六分代表在ASRB队列的靠前四分位数或十分位数中具有六PES的个体。(D)内核密度(y轴)针对ASRB参与者之间总PRS分布(x轴)的图形表示,所述参与者至少有一个PES在队列的靠前百分位数(灰色)中或没有(深灰色)。黑色虚线代表具有靠前百分位数PES(右)和没有(左)的队列的平均PRS总和
图7显示了使用有限高斯混合建模的全基因组PRS的聚类和升高的药物富集得分的个体计数。(A)聚类数量(x轴)针对贝叶斯信息标准(y轴;BIC)的图形表示。比例尺表示为组内协方差矩阵的参数化测试的十四种不同的高斯模型。(B)全基因组精神***症PRS的衍生聚类(x轴;总PRS)针对每个个体的ASRB队列靠前十分位数中的PES数量(y轴)的图形表示。方框=聚类1,圆圈=聚类2,三角形=聚类3,十字形=聚类4。
具体实施方式
除非另有定义,本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。尽管在本发明的实践或测试中可以使用与本文描述的那些相似或等效的任何方法和材料,但是描述了优选的方法和材料。除非另有说明,否则在整个公开中提及的所有专利、专利申请、公布的申请和出版物、数据库、网站和其他公布的材料都通过引用整体并入。如果术语定义有多种,则以本节的为准。在提及URL或其他此类标识符或地址的情况下,应理解此类标识符可更改,并且互联网上的特定信息可能易变,但可以通过搜索互联网找到等效信息。对标识符的提及证明了此类信息的可用性和公开传播。
冠词“一个”、“一种”和“该”包括复数方面,除非上下文另有明确规定。因此,例如,提及“一种药剂”包括单个药剂,以及两种或多种药剂;提及“一种治疗”包括单种治疗,以及两种或多种治疗;等等。
在本说明书通篇中,除非上下文另有要求,否则词语“包含”或变型(诸如“包含(comprises/comprising)”)将被理解为暗示包括所陈述的要素或整数或要素或整数组,但不包括任何其他要素或整数或要素或整数组。
药物开发流程在转化新化合物用于临床实践的方面仍然非常昂贵和耗时。为其他人类健康状况重新定位先前批准的药物可能是一种更容易实现的行动,特别是对于可以确定病因的罕见病症。然而,在精神***症等复杂病症中,这种方法受到病理生理学的复杂性和基因组风险的异质性以及疾病发作和临床过程的个体间差异的阻碍。对与复杂综合征相关的个体相关(个性化)遗传成分进行注释,以描绘具有临床意义的生物***,将更好地针对现有治疗并揭示药物再利用的新机会(图1)。如本文所述,已经开发了一种用于捕获具有已知药物相互作用的生物网络中常见变体风险的新方法——药物富集得分(PES),以促进与具有特定风险变体集的个体相关的精确治疗设计。本公开的PES方法的一个明显优势是它可以在与具有共同表型的其他人相比总体性状PRS较低的个体中捕获与药物作用相关的途径中多基因信号的潜在富集。即使在多基因负担高的情况下,全基因组PRS(作为生物学上未注释的仪器)不一定提供对适合个体药物干预的途径的见解。本文描述的用于选择精神***症GWAS中举例说明的推定药物靶标的方法揭示了药物再利用的潜在靶标,其具有潜在的临床效用。
在一个方面,本公开提供了一种用于治疗人类受试者的复杂病症的方法,包括:
a.鉴定一种或多种药理学相关的生物学途径,其包括以下步骤:
i.从多个患有复杂病症的个体和多个没有复杂病症的个体获得代表全基因组变体的数据;
ii.选择与所述复杂病症显著相关的多组变体,其中每组变体使用多个P值阈值(PT)鉴定;
iii.对所述多组变体中的每一个进行基因集关联分析,以鉴定富含与所述复杂病症显著相关的变体的基因集;
iv.对于每个鉴定出的基因集,生成对应于多个预定义注释类别的多个注释,其中所述多个预定义注释类别包括生物途径注释类别、药物靶标注释类别和治疗剂注释类别;
v.鉴定一种或多种药理学相关生物学途径,其中所述药理学相关生物学途径包括注释的生物学途径、注释的药物靶标和至少一种注释的治疗剂;和b.选择用于治疗受试者的复杂病症的治疗剂,其包括:
i.从受试者获得代表生物样品中全基因组变体的数据;
ii.使用步骤(a)(ii)中的所述多个PT的每一个,从受试者的全基因组变体数据,计算步骤(a)(v)中鉴定的所述药理学相关生物学途径的预测性多基因得分;和
iii.从所述复杂病症的治疗中选择至少一种批准的治疗剂,其中相对于参考值升高的预测性多基因得分表明所述受试者可能对至少一种注释的治疗剂敏感,
c.用选择的治疗剂治疗所述受试者。
复杂病症
如本文所用,术语“复杂病症”是指由不遵循在单基因(即孟德尔(Mendelian))病症中所见的相同预测遗传模式的多个基因的作用引起的病症。复杂病症是基因和环境的复杂相互作用的结果。因此,如果受试者具有遗传差异和环境暴露的正确组合,他们将患有复杂病症。本领域技术人员已知复杂病症,其示例性例子包括精神***症、重度抑郁症、心脏病、糖尿病、多发性硬化症、阿尔茨海默病、自闭症、帕金森病、哮喘和代谢紊乱。
在一个实施方案中,复杂病症选自糖尿病、多发性硬化症、精神***症、双相情感障碍、注意力缺陷多动障碍、重度抑郁症、强迫症、进食障碍、炎性病症、自身免疫病症、代谢紊乱、心血管疾病和癌症。在另一个实施方案中,复杂病症选自糖尿病、多发性硬化症、精神***症、双相情感障碍、注意力缺陷多动障碍、重度抑郁症、强迫症和进食障碍。在一个特定的示例性实施方案中,复杂病症是精神***症。
术语“复杂病症”还可以涵盖一种或多种“复杂性状”。术语“复杂性状”和“数量性状”在本文中可以互换使用,是指不表现出归因于单个基因座的经典孟德尔隐性遗传或显性遗传的任何表型。数量性状出现在基因型和表型之间的简单对应关系被打破的时候,因为相同的基因型可能导致不同的表型(即,由于机会、环境或与其他基因相互作用的影响)。因此,数量性状可以在个体之间在一定范围内变化,以产生表型的连续分布。数量性状对于本领域技术人员来说是已知的,其合适的例子包括身高、体重、血压、胆固醇水平和低密度脂蛋白(LDL)组成。
如本文所用,术语“性状”是指生物体的任何单一特征或可量化的测量值。性状可以是遗传的、环境决定的或两者的结合。
全基因组变体
如本文所用,术语“变体”是指与一个或多个参考DNA序列相比对DNA序列的任何修饰。变体可以涉及任何数量的相邻或间隔开的碱基或碱基系列,并且可以包括核苷酸的单核苷酸取代、***、缺失和嵌段取代、结构变体、拷贝数变体等。
在一个实施方案中,变体选自与复杂病症相关的常见SNP、CNV、基因缺失、基因倒位、基因复制、剪接变体和单倍型。在一个优选的实施方案中,变体是SNP。
如本文所用,术语“全基因组变体”是指与跨整个基因组的遗传变体有关的信息。此类信息包括基因组编码区和非编码区的变体。
在一个实施方案中,代表全基因组变体的数据选自单核苷酸多态性(SNP)基因型数据、拷贝数变体(CNV)数据、基因缺失数据、基因倒位数据、基因重复数据、剪接变体数据、单倍型数据或其组合。
在一个实施方案中,代表全基因组变体的数据是SNP基因型数据。
如本文所用,术语“SNP”或“单核苷酸多态性”是指个体之间的遗传变异;例如,生物体DNA中的单个含氮碱基位置是可变的。如本文所用,“SNPs”是SNP的复数。
如本文所用,术语“多态性”是指可变的基因座;也就是说,在一个群体中,多态性处的核苷酸序列具有一个以上的形式或等位基因。多态性的一个例子是“单核苷酸多态性”,它是基因组中单个核苷酸位置的多态性(特定位置的核苷酸在个体或群体之间变化)。
如本文所用,术语“基因”是指基因组中的一个或多个核苷酸序列,它们一起编码一种或多种表达的分子,例如RNA或多肽。基因可以包括被转录成RNA的编码序列,然后RNA可以被翻译成多肽序列,并且可以包括有助于基因复制或表达的相关结构或调控序列。
如本文所用,术语“基因型”是指个体(或个体群体)在一个或多个遗传基因座处的遗传构成。基因型由个体的一个或多个已知基因座的等位基因定义,通常是从其父母继承的等位基因的汇编。
如本文所用,术语“单倍型”是指个体在单个DNA链上的多个基因座处的基因型。通常,由单倍型描述的遗传基因座在物理上和遗传上是连锁的,即,在同一染色体链上。
术语“等位基因”是指在特定基因座处出现或编码的两种或更多种不同核苷酸序列之一,或由这种基因座编码的两种或更多种不同多肽序列。例如,第一个等位基因可以出现在一个染色体上,而第二个等位基因出现在第二个同源染色体上,例如,如杂合个体的不同染色体或群体中不同纯合或杂合个体之间发生的那样。多态性的一个例子是SNP,它是基因组中单个核苷酸位置的多态性(特定位置的核苷酸在个体或群体之间变化)。
如本文所用,术语“等位基因频率”是指等位基因在个体内、系内或系群内的基因座处存在的频率(比例或百分比)。例如,对于基因型“AA”、“Aa”或“aa”的等位基因“A”二倍体个体可以分别具有2、1或0的等位基因频率。可以通过对来自该系或群体的个体的样品的等位基因频率进行平均来估计系或群体(例如,病例或对照)内的等位基因频率。类似地,可以通过对构成群体的系的等位基因频率进行平均来计算系群内的等位基因频率。
如果个体在给定基因座处仅具有一种类型的等位基因(例如,二倍体个体在两个同源染色体中的每一个的基因座处具有相同等位基因的拷贝),则该个体是“纯合的”。如果在给定基因座处存在多于一种等位基因类型(例如,具有两个不同等位基因各一个拷贝的二倍体个体),则个体是“杂合的”。术语“同质性”表示组的成员在一个或多个特定基因座具有相同的基因型。相反,术语“异质性”用于表示组内个体在一个或多个特定基因座的基因型不同。
如本文所用,术语“基因座”是指染色***置或区域。例如,多态性基因座是多态性核酸、性状决定子、基因或标记所在的位置或区域。在另一个例子中,“基因位点”是物种基因组中可以找到特定基因的特定染色***置(区域)。
用于获得代表全基因组变体的数据的方法是本领域技术人员已知的,其示例性实例包括进行微阵列分析、大规模平行测序、扩增子测序、多重PCR、分子倒置探针测定、GoldenGate测定、等位基因特异性杂交、DNA聚合酶辅助基因分型、连接酶辅助基因分型和比较基因组杂交(CGH)。或者,代表全基因组变体的数据可以从已公开的数据集中获得。
在一个实施方案中,代表全基因组变体的数据从全基因组关联研究(GWAS)汇总统计中获得。
在本文中考虑,可以使用一种方法获得表示来自患有复杂病症的多个个体和不具有复杂病症的多个个体的全基因组变体的数据,该方法可不同于用于从受试者获得表示全基因组变体的数据的方法。例如,可以通过SNP微阵列获得来自多个患有复杂病症的个体和多个没有患有复杂病症的个体的SNP基因型数据,而来自受试者的SNP基因型可以通过大规模平行测序获得。
在一个实施方案中,代表来自多个患有复杂病症的个体和多个没有复杂病症的个体的全基因组变体的数据从GWAS获得。GWAS是对不同个体的全基因组遗传变体集的观察性研究,以查看是否有任何变体与性状相关。GWAS已经鉴定了大量与人类疾病显著相关的遗传变体。这些与疾病相关的变体为进一步研究和假设疾病机制提供了候选基因。GWAS还证实了复杂病症的多基因性质,特别是对于精神疾病。例如,GWAS研究表明,大量弱关联SNP的累积效应,其中大多数单独没有统计学意义。
与复杂病症显著相关的变体通过对表示来自患有复杂病症的多个个体(即,病例)和多个没有复杂病症的个体(即,对照)的全基因组变体的数据进行统计比较进行过滤。根据本文公开的方法,在多个P值阈值(PT),进行变体的过滤。
在一个实施方案中,PT中的至少一个鉴定了与复杂病症相关的所有变体,即PT足够允许以能够识别在病例群体中比在对照群体中更常见的所有变体。
当变体可以与给定PT的表型在统计学上相关联(正或负)时,它与特定表型(即复杂病症)“显著相关”。也就是说,相比于对照群体(例如,多个没有复杂病症的个体),变体更常见于病例群体(例如,多个患有复杂病症的个体)。
基因集关联分析
术语“基因集关联分析”或“GSAA”是指用于测试多个变体的累积效应的计算方法。如本文其他地方所述,由于复杂病症的多基因性质,测试与功能相关变体集的关联可以为多种遗传风险因素提供生物学背景。此外,鉴于大多数与常见变体相关联的效应量较小,检查多个变体的累积效应可以提高检测复杂病症的遗传风险因素的能力。最后,在途径水平上测试关联也可以解释受影响人群中的遗传异质性。由于研究人群中的遗传异质性会导致混合的小遗传效应,因此可以使用GSAA检测它们的累积效应。
基因集关联包括对在该集中没有基因与自包含构建体中的表型相关的空值假设的检验,或空值的集基因与表型的相关性不强于在竞争构建体中所有其他基因。至少,基因集关联通过将该集与空值进行比较的任何统计方法来测试这些基本假设。合适的统计方法对于本领域技术人员来说是已知的,其说明性实例包括测试统计(例如,基于平均值、基于等级、基于计数的测试统计,或其组合)和数学变换方法(即,分析的单位)。例如,在本发明的一个实施例中,可以处理GWAS汇总统计以首先将变体聚合成基因,然后进行由基因集驱动的关联的多变量检验。这些综合P值组合方法包括检验统计,用于对映射到每个基因的所有P值求和,其中每个基因的总P值相对于空值分布得出,这取决于为每个组合选择的单个P值的性质和/或转换。因此,对于这个实施方案,基因P值形成基因集关联的基础。
基因集关联分析可以包括在基因水平测试变体的组合效应的多个步骤。例如,作为二次分析,相关质量控制和数据清理程序可应用于输入数据(例如,SNP P值),此后,基因集基于例如蛋白质编码基因来定义。因此,变体被映射到基于参考基因组的蛋白质编码基因,即任何当前或未来的参考序列,例如人类基因组组装38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1)。
本领域技术人员会理解,可以调整蛋白质编码基因的基因边界以捕获潜在的调节变化。基因边界的合适变化可以涵盖上游约10kb和下游约10kb之间,优选地上游约9kb和下游约9kb之间,优选地上游约8kb和下游约8kb之间,优选地上游约7kb和下游约7kb之间,优选地上游约6kb至下游约6kb之间,优选地上游约5kb至下游约5kb之间,优选地上游约5kb至下游约4kb之间,优选地上游约5kb至下游约3kb之间,优选地上游约5kb和下游约2kb之间,优选地上游约5kb和下游约1.9kb之间,优选地上游约5kb和下游约1.8kb之间,优选地上游约5kb和下游约1.7kb之间,优选地上游约5kb和下游约1.6kb之间,更优选地上游约5kb和下游约1.5kb之间。
然后可以估计其他数据处理步骤,例如标志物之间的连锁不平衡(LD)分析,然后计算基因水平关联,以使用例如每个基因的P值的平均值χ2统计、Fisher方法、Stouffer方法和Liptak-Stouffer(LST)方法来量化基因中所有P值的聚合效应。
在一个实施方案中,基因集关联分析是回归分析。如本文所用,术语“回归分析”是指用于估计变量之间关系的一组统计过程。合适的回归分析是本领域技术人员已知的,其说明性实例包括线性和非线性回归、贝叶斯方法、百分比回归、最小绝对偏差、非参数回归和距离度量学习。
进行基因集关联分析的方法和工具对于本领域技术人员来说是已知的,其示例性例子包括基因组注释的多标记分析(MAGMA)、GSAASeqSP和i-GSEA4GGWAS。
功能注释
序列变体的注释提供了与特定变体、变体集或变体富集的基因集的功能(即生物学)相关性。根据本文公开的方法,针对被鉴定为与复杂病症显著相关的每个基因集,生成对应于多个预定义注释类别的多个注释。
在一个实施方案中,预定义注释类别包括生物途径注释类别、药物靶标注释类别和治疗剂注释类别。在另一个实施方案中,预定义注释类别包括生物途径注释类别、药物靶标注释类别、治疗剂注释类别、膳食补充剂类别和生活方式干预注释类别。
生物学途径注释类别包括可以基于生物学、分子和/或功能关系将基因和变体彼此联系起来的信息。这些关系对于基于途径的过程关联方法或推断特定变体的表型影响有用。在本文公开的方法中,具有至少一种变体的基因的基因本体生物学过程用于提供生物学关系。高质量的典型和标志基因集提供了生物学关系。合适的典型和标志基因集对于本领域技术人员来说是已知的,其示例性实例包括MSigDB(https://software.broadinstitute.org/gsea/migsigdb/)、Kyoto Encyclopedia of Genes andGenomes(KEGG)、Reactome途径数据库和BioCarta途径集合。
药物靶标注释类别确定生物途径是否与“可成药”相互作用重叠。合适的“可成药”相互作用对于本领域技术人员来说是已知的,其说明性实例包括“可成药基因组”(Hopkins&Groom,2002,Nature Reviews Drug Discovery,1:727-730)和靶标中央资源数据库(TCRD)。
治疗剂注释类别确定至少一种基因中的变体是否已知与DrugCentral数据库(也称为TClin,N途径)中的批准药物相互作用。
膳食补充剂注释类别确定是否可以用膳食补充剂修饰至少一种已知与可成药相互作用重叠的基因中的变体。提供此类膳食补充剂信息的合适数据库对于本领域技术人员来说是已知的,其说明性例子包括计算机访问膳食补充剂研究(CARDS)数据库、膳食补充剂标签数据库(DSLD)和DrugCentral数据库。
生活方式干预注释类别确定是否可以通过生活方式干预来修饰至少一个已知与可成药相互作用重叠的基因中的变体。提供这种生活方式干预信息的合适数据库对于本领域技术人员来说是已知的,其说明性实例包括干预(I)数据库。在本文公开的方法中,生活方式干预注释也可以从文献数据库中的关键术语的本体学搜索中得到。合适的文献数据库是本领域技术人员已知的,说明性实施方案包括MEDLINE、Embase、Web of Science、Cochrane图书馆、评论和传播中心数据库、Joanna Briggs研究所数据库、EPPI-CentreDatabase of Promoting Health Effectiveness Reviews和CINAHL数据库。
在一个实施方案中,对于一个或多个基因或基因集中的变体,药理学相关途径富含生物学途径注释、药物靶标注释和至少一种批准的治疗剂注释。在另一个实施方案中,对于一个或多个基因或基因集中的变体,药理学相关途径富含生物学途径注释和药物靶标注释。技术人员将理解,在特定药物相互作用注释类别中富集变体的基因集中的基因数量会有所不同。在一个实施方案中,鉴定的基因集将具有一个基因,优选两个基因,或更优选三个基因的最小重叠。
治疗或预防复杂病症的方法
如本文所用,术语“治疗(treat)”、“治疗(treating)”、“治疗(treatment)”、“预防(prevent)”、“预防(preventing)”、“预防(prevention)”、“预防(prophylaxis)”等是指以任何方式补救、预防、阻碍、延缓、改善、减少、延迟或逆转复杂病症或其一种或多种不期望症状的进展的任何和所有方法。因此,术语“治疗”和“预防”等应在其最广泛的背景中考虑。例如,治疗并不一定意味着患者接受治疗直到完全康复。复杂病症的特征在于多种症状,因此治疗不一定需要补救、预防、阻碍、延缓、改善、减少、延迟或逆转所有所述症状。本公开的方法可以涉及“治疗”复杂病症,以减少或改善与复杂病症相关的高度不期望事件或症状的发生或病症进展的结果,但其本身可能不预防事件、症状或结果的最初发生。因此,治疗包括改善复杂病症的症状或预防或以其他方式降低出现复杂病症症状的风险。
如本文所用,术语“药剂”包括诱导期望的药理学和/或生理学效应的化合物。该术语还涵盖本文具体提及的那些化合物的药学上可接受的和药理学活性的成分,包括但不限于盐、酯、酰胺、前药、活性代谢物、类似物等。当使用上述术语时,本领域技术人员将理解,这包括活性剂本身以及药学上可接受的药理学活性的盐、酯、酰胺、前药、代谢物、类似物等。术语“药剂”不应狭义地解释,而是延伸到小分子、蛋白质分子如肽、多肽和蛋白质以及包含它们的组合物和遗传分子如RNA、DNA及其模拟物和其化学类似物以及细胞因子。术语“药剂”还包括能够产生和分泌本文提及的药剂的细胞,以及包含编码这些药剂的核苷酸序列的多核苷酸。因此,术语“药剂”扩展到核酸构建体,其包括用于在一系列细胞中表达和分泌的载体,例如病毒或非病毒载体、表达载体和质粒。
根据本文所述的方法,治疗剂不限于已被批准用于特定治疗复杂病症的药剂。例如,本文所述的治疗剂可以是已获准用于治疗其他人类健康状况的药剂。这种对已批准治疗剂的“标签外(off-label)”使用被称为“再利用”,这扩大了可用于治疗患有复杂病症的受试者的可用药物的范围。
如本文所用,术语“生物样品”是指可以来自或来源于人类受试者的任何样品,例如体液(血液、唾液、尿液等)、组织活检、组织和/或来自患者的废物。因此,组织活检、粪便、痰液、唾液、血液、淋巴液、泪液、汗液、尿液、***分泌物等可以容易地筛选SNP,基本上任何含有适当核酸的感兴趣组织也可以。样品可以是直接取自患者的形式,或者可以至少部分地处理(纯化)以去除至少一些非核酸物质。
在一个方面,本公开提供了一种用于在处于发展复杂病症风险的受试者中预防复杂病症的方法,包括:
a.鉴定一种或多种药理学相关的生物学途径,其包括以下步骤:
i.从多个患有复杂病症的个体和多个没有复杂病症的个体获得代表全基因组变体的数据;
ii.选择与所述复杂病症显著相关的多组变体,其中每组变体使用多个P值阈值(PT)鉴定;
iii.对所述多组变体中的每一个进行基因集关联分析,以鉴定富含与所述复杂病症显著相关的变体的基因集;
iv.对于每个鉴定出的基因集,生成对应于多个预定义注释类别的多个注释,其中所述多个预定义注释类别包括生物途径注释类别、药物靶标注释类别、治疗剂注释类别、膳食补充剂注释类别和生活方式干预注释类别;和
v.鉴定一种或多种药理学相关生物学途径,其中所述药理学相关生物学途径包括注释的生物学途径和注释的药物靶标;
b.选择治疗以预防复杂病症的发展,其包括以下步骤:
i.从受试者获得代表生物样品中全基因组变体的数据;
ii.使用步骤(a)(ii)中的所述多个PT的每一个,从受试者的全基因组变体数据,计算步骤(a)(v)中鉴定的所述药理学相关生物学途径的预测性多基因得分;和
iii.将受试者鉴定为处于发展复杂病症的风险中,其中相对于参考值升高的预测性多基因得分表明受试者可能处于发展所述复杂病症的风险中,其中具有相对于参考值升高的预测性多基因得分的药理学相关生物学途径具有选自治疗剂注释、膳食补充剂注释和生活方式干预注释的至少一个附加注释,以及
c.用一种或多种注释的治疗剂、膳食补充剂或生活方式干预治疗所述受试者以防止所述复杂病症的发展。
用于预防复杂病症的治疗方案通常取决于因素,包括但不限于复杂病症的类型以及受试者的年龄、体重和一般健康状况。另一个决定性因素将是根据通过本文公开的方法计算的药理学相关生物学途径的预测多基因得分发展复杂病症的风险水平。例如,对于被确定为具有发展复杂病症的高风险的受试者,与被认为发生复杂病症的风险低或较低的受试者相比,可以开出更积极的治疗方案。
药物富集得分
如本文所用,术语“药物富集得分”或“PES”是指基于从取自患有复杂病症的受试者的生物样品获得的全基因组变体信息中变体的存在或不存在,对于药理学相关生物学途径计算的预测性多基因得分。
本文所述的PES提供了个体暴露于可能被现有药剂治疗的变体的定量测量,包括先前没有考虑或测试受试者正在经历的特定复杂病症的那些药剂治疗。通过关注具有已知药物靶标的生物途径,本文公开的方法通过提供鉴定治疗靶标和/或重新利用已知治疗剂的机会来增强多基因风险方法或“多基因风险得分”的临床效用。
术语“多基因风险得分”用于定义个体发展复杂病症或进展到疾病更晚期阶段的风险,这基于大量、通常数千种常见遗传变体,其中每一个变体可能对疾病或其进展具有适度的个体效应量贡献,但总体而言具有显著的预测价值。在目前的情况下,多基因风险得分可用于预测患者使用与复杂病症相关的常见单核苷酸SNP发展复杂病症的可能性。然而,全基因组多基因风险评分(作为一种生物学上未注释的工具)并不一定能深入了解适用于个体药理学干预的途径。
根据本文公开的方法,给定药理学相关途径的升高的PES指示受试者将对已知与药学相关途径相互作用的治疗剂敏感。如本文其他地方所述,PES升高与多基因风险没有显著相关性。因此,相对于具有相同复杂病症表型的其他人,在总体性状PRS低的受试者中,在与药物作用相关的途径中,PES方法可以捕获多基因信号的潜在富集。
在一个实施方案中,PES是从映射到形成候选药理学可操作基因集的基因的SNP计算的。这可以包括模型(1),该模型将基因集中每个变体的统计效应量乘以所述变体的等位基因计数(剂量)相加。例如,对于个体i,让
Figure BDA0003490393760000181
表示基因集中每个变体j的GWAS的统计效应量,乘以i中j的剂量(G)。
Figure BDA0003490393760000182
参考预测性多基因得分
本文公开的方法包括比较步骤(即,以鉴定受试者是否将对试剂作出反应),其中将从受试者的生物样品中获得的全基因组变体确定的基于变体的存在或不存在的每个药理学相关生物学途径的预测多基因得分与参考预测性多基因得分进行比较;参考预测性多基因得分即与对治疗剂的敏感性相关的每个药理学相关生物学途径的已知或预定预测性多基因得分,如本文别处所述。
术语“参考预测性多基因得分”可与术语“参考药源性富集得分”或“参考PES”互换。在说明性实例中,可以使用参考预测型多基因得分进行比较,该参考预测性多基因得分代表来自个体、来自大型参考队列或病例队列以及所讨论复杂病症表型的对照的已知或预定的预测性多基因风险得分,如本文其他地方所述,这与对治疗剂的敏感性有关。
参考预测性多基因得分通常是特定队列或受试者群体中的预定预测性多基因得分(例如,正常健康对照、具有所讨论的复杂病症表型的受试者、在获得参考样品时没有复杂病症的症状但继续发展复杂病症的受试者等)。参考值可以表示为绝对数,或表示为平均值(例如,平均值+/-标准偏差),例如当参考值源自(即,代表)个体的群体时。
虽然本领域技术人员将理解,使用源自个体样品群体的参考预测性多基因得分可能提供该特定群体中预测性多基因得分的更准确表示(例如,出于本文公开的方法的目的),但在一些实施方案中,参考预测性多基因得分可以是源自从单个生物样品获得的全基因组变体信息的预测性多基因得分。
计算机***
本公开还考虑了能够根据本文公开的方法进行格式化、分析、注释和处理的计算过程或***。因此,在一个方面,提供了一种基于计算机的基因组注释***,其包括被配置为存储指令的非暂时性存储器和与所述存储器耦合的至少一个处理器,所述处理器被配置为:
a.从多个患有复杂病症的个体和多个没有复杂病症的个体接收全基因组变体数据;
b.处理所述全基因组变体数据以选择与所述复杂病症显著相关的多组变体,其中每组变体使用多个P值阈值(PT)鉴定;
c.对所述多组变体中的每一个进行基因集关联分析,以鉴定富含与所述复杂病症显著相关的变体的基因集;
d.对于每个鉴定出的基因集,生成对应于多个预定义注释类别的多个注释,其中所述多个预定义注释类别包括生物途径注释类别、药物靶标注释类别和批准治疗剂注释类别;和
e.鉴定一种或多种药理学相关生物学途径,其中所述药理学相关生物学途径包括注释的生物学途径、注释的药物靶标和至少一种注释的批准治疗剂;
在一个实施方案中,基于计算机的基因组注释***还包括单独的计算方法以询问个体受试者的基因型以选择适合于治疗复杂病症的药剂,该方法包括:
a.从受试者的生物样品中接收全基因组变体数据;
b.使用所述多个PT的每一个,从受试者的全基因组变体数据,计算所述药理学相关生物学途径的预测性多基因得分;和
c.从所述复杂病症的治疗中选择至少一种治疗剂,其中相对于参考值升高的对于每个PT计算的预测性多基因得分表明所述受试者可能对至少一种注释的治疗剂敏感。
***输出基础的该计算方法以并行方式进行,并且包括完全相互独立的变体注释类别、串行相关注释,其执行取决于先前注释和通过组合或多个注释类别生成新信息的注释的完成和状态。在优选实施方案中,***输出基础的计算过程以并行方式进行并且包括串行依赖注释的类别,由此药物靶标注释类别的执行取决于生物途径注释类别的完成等等。
用于根据本文公开的方法进行处理的合适的数据输入对于本领域技术人员来说是已知的,其示例性实施方案包括GWAS汇总统计、基因定义文件、LD参考、基因集的定义和基因型数据(例如,PLINK二进制、PLINK文本、VCF、BCF、牛津格式、23andMe文本、VDS、gVCF、KGGseq二进制文件集,包括其版本和相应的格式参数)。
本说明书中提及的所有出版物均通过引用并入本文。本说明书中对任何先前出版物(或从其衍生的信息)或任何已知事项的引用不是也不应被视为知晓或承认或任何形式的暗示该先前出版物(或从其衍生的信息)或已知事项构成本说明书所涉及努力的领域中的公知常识的一部分。
本领域技术人员将理解,在不背离广泛描述的本公开的精神或范围的情况下,可以对本公开进行多种变化和/或修改。因此,本发明实施方案在所有方面都被认为是说明性的而不是限制性的。
现在将通过参考以下具体实施例更详细地描述本公开,其不应被解释为以任何方式限制本公开的范围。
实施例
材料和方法
药理学相关基因集的管理
高质量的典型和标志基因集来源于分子特征数据库MSigDB(https://software.broadinstitute.org/gsea/msigdb/)。典型途径源自Kyoto Encyclopedia ofGenes and Genomes(KEGG)、Reactome途径数据库和BioCarta途径集合。标志基因组由MSigDB管理。为了选择具有潜在药物靶标的途径,我们利用了来自靶标中央资源数据库(TCRD)的基因定义。研究中包括与一个或多个最高置信度可成药基因重叠的途径,即具有与已批准药物相互作用的已知靶标的基因(TClin)。使用DGidb v3.02将药物映射到基因集,其中基于TClin基因和药物之间的相互作用置信度的DGidb得分选择每个途径的前FDA批准的药物。在ClinicalTrials.gov(https://www.clinicaltrials.gov/)中检索到每种药物登记的精神***症的临床试验。ATC代码对每种药物进行了注释,并且源自WHO药物统计方法合作中心提供的ATC 2018指数(https://www.whocc.no/atc_ddd_index/)。
基因集关联分析
下载和处理了来自GWAS的针对双相情感障碍、注意力缺陷多动障碍、重度抑郁症、强迫症、进食障碍和2014年精神病基因组学联盟(PGC)精神***症巨型GWAS(Schizophrenia Working Group of the Psychiatric Genomics et al.,2014,Nature,511:421-427)的完整汇总统计。根据其显著性(P值)选择变体以包含在四个不同的阈值中-所有SNP(NSNPs=9444230),P<0.5(NSNPs=5423694),P<0.05(NSNPs=1085118),和P<0.005(NSNPs=302313)。使用MAGMA(基因组注释的多标记分析)对每个阈值进行关联基因集(deLeeuw et al.,2015,PLoS Computational Biology,11:e1004219)。首先,将SNP映射到蛋白质编码基因(hg19,NCBI),其中将基因边界调整为涵盖上游5kb和下游1.5kb,以捕获潜在的调节变异。通过MAGMA,使用1000Genomes Phase 3European参考序列集(referencepanel)估计标记之间的连锁不平衡(LD)。由于该区域的单倍型的复杂性,扩展的主要组织相容性复合体(MHC)区域内的基因被排除在本研究之外。
MAGMA模型的参数简要地包括,使用每个基因的P值的平均χ2统计,计算基因水平关联。在P值到Z值的概率转换后,使用可成药基因集作为输入进行竞争性基因集关联。设定P<0.001的显著性阈值以包含进一步分析的途径。使用WebGestalt(Wang et al.,2017,Nucleic Acids Research,45:W130-W137),通过过度代表性分析(Fisher’s Exact Test)计算每个基因集的富集药物(DrugBank靶标),其中使用Benjamini-Hochberg错误发现率(FDR)方法调整三个基因的最小重叠和P值的多重测试校正。在候选者的下游分析中未考虑具有“研究性”ATC注释的药物。此外,使用FUMA的GENE2FUNC应用程序研究了来自八种途径的所有基因的组织特异性表达(Watanabe et al.,2017,Nature Communications,8:1826)。与整个蛋白质编码基因组相比,测试了GTEx v7数据集中53种组织类型的每一种中输入途径基因的转录表达的上调、下调和两侧差异表达。在该框架中还测试了GWAS目录中相关性状的输入基因的富集。
研究队列的描述
在本研究中进行基因分型的个体来自澳大利亚精神***症研究库(ASRB),该库是一大群精神***症病例的临床和认知测量、神经影像学和DNA的公共数据库,以及来自几个澳大利亚研究站点的没有精神病直系家族史的筛选对照(Loughlan et al.,2010,Australian and New Zealand Journal of Psychiatry,44:1029-1035)。在去除基因分型后质量控制中的个体后,本研究分析了425名精神***症病例和251名对照,病例中67%为男性,而男性占对照组的44%。
基因分型和质量控制
Illumina Infinitium Human 610K(610-Quad)BeadChip平台用于根据标准制造商方案对从外周血单核细胞中提取的基因组DNA进行基因分型。常染色***点仅用于插补,使用PLINK 1.9实施以下插补前质量控制(QC)过滤器(Purcell et al.,2007,AmericanJournal of Human Genetics,81:559-575):次要等位基因频率<0.01,调用率<98%和Hardy-Weinberg平衡P<10-6。未分配给链的模糊SNP也被过滤掉。一对近交系数(IF)>0.2的个体和性别信息不一致的受试者被去除。在相对连锁平衡(R2<0.1)中对高质量常染色体SNP(MAF>0.05)进行相关性测试,其中删除了长程LD的区域。按州的全基因组身份移除了具有高相关性的个体(N=9,pi_hat>0.185)。分析仅限于队列中的欧洲受试者。人口异常值(N=63)是通过在PLINK 1.9中进行的主成分分析(PCA)排除的,其中用k-means聚类去除异常值,其中五个生成的聚类代表1000个基因组第3阶段参考组超群。对通过QC的个体的常染色***点进行插补。单倍型由Eagle 2.3.2以十兆碱基块和500千碱基重叠分阶段(Loh etal.,2016,Nature Genetics,48:1443-1448),然后使用默认参数和1000个基因组第3阶段欧洲参考组以Minimac3插补(Fuchsberger et al.,2015,Bioinformatics,31:1466-1468)。保留了具有低错误率(<2%)和INFO插补得分大于0.8(R2>0.8)的高质量站点(NSNPs=7199582)。
药物富集得分(PES)的个体分析
使用PRSice2(Euesden et al.,2015,Bioinformatics,31:1466-1468)计算来自GWAS分析的每个重要基因集的PES。--fastscore标志计算了本研究中使用的五个P阈值的预测性多基因得分(即PES)。从基因型文件中去除扩展的MHC区域后,在评分之前使用标准PRSice2参数将变体聚集在一起。对于每个PES,对应于从GWAS中识别出基因集的P阈值是队列中每个成员记录的得分。解释全基因组PRS(PRS总和)的病例和对照之间最大差异的阈值是使用Nagelkerke’s R2选择的。使用二项式逻辑回归进行每个得分与所选阈值处病例的关联,针对性别和前三个主要成分对其进行调整。P值是使用Wald检验得出的,有和没有在最佳阈值处的总PRS得分作为模型中的协变量。
将每个PES在整个ASRB队列中排名,实施了三种PES升高的测量:人群的靠前百分位数、十分位数和四分位数。通过这些阈值的途径的数量对每个个体进行总计,并使用与上述单变量PRS相同的模型评估这些总数与精神***症之间的关联。
基于高斯混合建模的PRS聚类
使用概率有限高斯混合建模(GMM)和mclust软件包5.4版在精神***症队列中调查了ASRB的靠前十分位数中的PRS总和的潜在聚类和PES总数(Scrucca et al.,2016,The RJournal,8:289-317)。简而言之,每个聚类的形状、体积和方向由方差-协方差矩阵确定(表1)。使用贝叶斯信息准则(BIC)的最高值选择参数的数量及其几何特征。
表1.用于组内协方差矩阵参数化的高斯模型的几何特征
Figure BDA0003490393760000241
*描述的高斯模型在mclust软件包中执行。
统计分析
利用MAGMA的基因基关联、利用PRSice-2进行的PES得分计算、利用WebGestalt网络应用程序的药物过度表示测试、以及由FUMA进行的组织特异性表达分析。所有其他统计分析均在R版本3.4.4中进行。使用glm函数构建了针对性别和前三个主要成分进行调整的二项式逻辑回归模型,以测试与对照相比,ASRB精神***症病例中每种衍生PES的富集,其中有和没有用于全基因组PRS的协变。将显著性为P<5.5x10-3的多重测试阈值设置为通过Bonferroni方法解释九个测试。其他二分关联测试(即,在靠前百分位数PES的携带者中富集PRS,靠前四分位数/十分位数PES的数量与情感状态之间的关联)在不同的模型中使用相同的参数进行。GMM是使用mclust软件包进行的。我们测试了四个GMM衍生聚类中的每个的精神***症病例是否对于靠前百分位数PRS途径的携带者被过度代表,这使用多项逻辑回归和nnet软件包(https://cran.r-project.org/web/packages/nnet/index.html)。最大的聚类,聚类2,被用作其他聚类的参考,其中模型对于上述的性别和主要成分进行协变。在将回归系数除以其标准误差以得出z后,使用Wald检验计算P值。
实施例1
临床可操作途径在神经精神疾病常见变体风险的荟萃分析中具有重要意义
使用MAGMA,来自GWAS的关于精神***症、双相情感障碍、注意力缺陷多动障碍、重度抑郁症、强迫症和进食障碍的汇总统计被处理用于基因集关联荟萃分析。考虑具有不同P值阈值(PT)输入(P<1、P<0.5和P<0.05)和0.05的FDR阈值的三种模型,有16个不同的基因集具有重要的已知药物靶标(表2)。对各自GWAS中P<0.5的SNP的荟萃分析产生了最多数量的重要途径,为七个,其次是P<0.05,为六个,以及P<1,为三个。胰岛素分泌调节和能量代谢整合这两个基因集在P<1阈值下相关,但幅度小于使用P<0.5截止值时的幅度。代表了几种与神经学相关的信号途径,包括Wnt、类视黄醇、GABAergic和神经生长因子(NGF)信号传导。
表2.交叉神经精神障碍荟萃分析的多重测试校正后具有已知药物靶标的重要途径
途径 P阈值(P<sub>T</sub>)<sup>*</sup> P<sub>调整后</sub>#
调节胰岛素分泌 P<0.5 2.75x10<sup>-3</sup>
能量代谢整合 P<0.5 6.07x10<sup>-3</sup>
神经元*** P<0.5 6.07x10<sup>-3</sup>
MAPK信号传导途径 P<1 6.07x10<sup>-3</sup>
Wnt途径 P<0.05 0.0181
RXR:VDR途径 P<0.05 0.0181
跨化学突触的传输 P<0.5 0.0191
GABA途径 P<1 0.0191
NGF传导信号 P<1 0.0191
凋亡执行阶段 P<0.05 0.0241
EGFR SMRTE途径 P<0.05 0.0292
钾通道 P<0.5 0.0292
Wnt传导信号 P<0.05 0.03
顶端交界处 P<0.05 0.0341
扩张型心肌病 P<0.5 0.0341
#FDR调整后的P值。*P阈值是指在荟萃分析中包含P值,即P<0.05表示仅保留P值小于至少一个GWAS的阈值的唯一SNP。
研究了包含重要途径(N=1072)的基因在(i)离散组织和(ii)脑中的发育时间点中的表达特异性(图2)。相对于蛋白质编码基因组的其余部分,途径成员在大脑中高度上调(P调整后=1.413x10-86),其中前扣带皮层是最富集的区域。有趣的是,包括胃、小肠和脂肪在内的几种外周组织存在显著下调(P调整后<0.05)。这些转录本在不同时期在大脑中的时间表达显示,在四个月至36岁的十个不同年龄时富集,在一年达到峰值,同时在子宫内的分离时间点出现显著的神经下调(图2)。
在应用多重测试校正后,有173种药物的靶标在一种或多种候选途径中显著过度表示(P调整后<0.05)。大多数基因集在此阈值以下至少有一个显著的过度表示(N=12)。通过解剖治疗化学分类***(ATC)的最常见的药物分类是神经***(ATC代码级别1:N,N=95),其次是心血管***(ATC=C,N=61),以及消化道和代谢(ATC=A,N=49)。在神经***分类中,使用二级代码,这些药物中的大多数是精神病药物(ATC=N05,N=46),除抗帕金森病药物(ATC=N04)外,其他六个N0级代码的分类存在。在下一个ATC代码级别,催眠药和镇静剂(ATC=N05,N=25)占主导地位,而在最详细的ATC代码(4级)中,苯二氮
Figure BDA0003490393760000271
衍生物是最常见的分类(ATC–N05BA,N=14)。
实施例2
从GWAS汇总统计数据中识别可成药途径的管道
图3中的示意图概述了为本研究开发的用于构建药源富集得分(PES)的方法。利用基因集关联分析来聚合来自GWAS的变体,以识别可能是药物干预候选者的基因集。
第一步,使用MAGMA方法测试基因水平上变体的组合效应。简而言之,当使用汇总统计作为输入时,MAGMA将映射到每个基因的变体的P值结合起来,并与已知的抽样分布进行比较得出关联。传统上,这些模型使用汇总统计中可用的全宽度变体。然而,这可能会遗漏基因组信号生物学解释的重要方面。来自大型GWAS队列的PRS在不同的P值阈值(PT)进行测试,以利用解释病例组和对照组之间的最大差异(在二分结构中)的模型。已建议PT范围最适合在几种疾病中进行PRS分析。因此,聚合不同PT的基因的变体的综合效应可以以不同程度的多基因性捕获基因组信号的生物学复杂性。
MAGMA通过基因Z值的回归、它们的P值的概率转换来进行指定基因集的竞争性关联。因此计算在下降PT处富集GWAS信号的途径。在这项研究中,我们试图关注可能与已知治疗剂相互作用的途径。利用源自分子特征数据库(MSigDB;Liberzon et al.,2015,CellSystems,1:417-425)的高质量规范和标志基因集,基于来自靶标中央资源数据库(TCRD)的基因分类过滤途径,其以来自NIH Illuminating the Druggable Genome initiative(Oprea et al.,2018,Nature Reviews Drug Discovery,17:317-332)的数据为特征。具体来说,如果途径包含至少一个被注释为与DrugCentral数据库中批准的药物相互作用的基因(称为TClin,N途径=1012),则途径被归于临床相关。
一旦发现了具有已知药物靶标的富集途径,就可以在个体水平上计算来自这些基因集内变体的PRS,我们将其称为药源富集得分(PES)。在临床可操作途径中具有升高的PES的受试者可能是使用已知可调节它的药物进行干预的候选者。这种方法的一个关键优势是它能够检测无偏见的途径水平关联,这可能揭示新的药物再利用机会。
实施例3
富集精神***症常见变体风险的临床可操作途径
在精神***症中,一种具有大约0.7%的人群患病率的精神病学综合征,传统上估计遗传率在80%的范围内。通过PGC进行的全球合作已经积累了大量精神***症病例,以通过GWAS限定与该疾病相关的基因组变体。迄今为止,已经在严格的全基因组显著性水平上鉴定了100多个基因座,GWAS包含的常见变体显示占精神***症遗传率的显著部分。然而,它在治疗中的应用并没有很好的定义,特别是因为它没有提供对传统抗精神病药范式之外的新临床干预的了解。
为了解决这个问题,我们在一组精神***症患者(N=425)中分析了PES,并从ASRB收集的样品中筛选了健康对照(N=251)。为了确定临床上可操作的基因集并构建PES,我们处理了2014PGC精神***症巨型GWAS。使用MAGMA,在四个PT(PT<1、PT<0.5、PT<0.05、PT<0.005)的过滤路径上进行基因集关联。由于可能会混淆模型的其单倍型复杂性,将六号染色体上的扩展主要组织相容性复合体(MHC)区域从分析中去除。为了捕获复杂表型(如精神***症)的多种途径,我们使用P<0.001的名义显著性阈值来包含途径。从具有已知药物靶点的不同PT的精神***症GWAS中选择了八个基因集(表3)。最显著相关的基因集是HIF-2途径(P=3.12x10-5、β=0.435、SE=0.109、PT<0.005),它由缺氧诱导因子2(HIF-2)α转录因子网络中的基因组成。叶酸的一个碳库是具有假定药物相互作用的第二重要途径(P=1.4x10-4、β=0.433、PT<0.05)。将两个基因集与神经递质GABA和乙酰胆碱的功能相关,而代表的其他信号途径是NOS1(一氧化氮合酶I)、Hedgehog信号传导途径和Sema3A信号传导途径中与信号素相关的CRMP(坍塌反应调节子(Collapsin Response Mediator))蛋白。此外,胰岛素分泌调控基因集通过了纳入阈值。相对于蛋白质编码基因组的其余部分,构成这八种途径的基因在大脑中的表达上调,其中在多次测试校正后,前扣带皮层是最富集的区域,PAdj=6.45x10-13。相反,在包括胃和皮肤在内的几个外周组织中它们被下调(PAdj<0.05)(图4)。这些基因在GWAS目录中与精神病学相关的性状也过多表示,包括精神***症、创伤后应激障碍、尼古丁依赖和认知表现(PAdj<0.05,表4)。
表3.富集与精神***症相关的常见变异的途径,其具有推定的临床可操作性
Figure BDA0003490393760000291
*具有推定临床可操作性的途径,因为针对具有再利用潜力的现有药物具有靶标。
#PGC GWAS中与精神***症相关的基因水平聚合SNP的富集P值。
表4.与精神病学相关的GWAS目录性状中候选PES途径内基因的过度表示
Figure BDA0003490393760000301
我们的管道优先考虑的八个基因集表示药物类别的不同范围。我们试图研究可用于每个PES输入途径的候选药物的选择。首先,我们从每个基因集中提取了在TCRD中分类为TClin的基因,并使用药物基因相互作用数据库(DGidb v3.02,表5),将它们与它们的已知药物相互作用相匹配。基于TClin基因和药物之间的相互作用置信度的DGidb得分选择每个途径的前FDA批准的药物。通过解剖化学(ATC)分类***进行注释后,两种候选药物是抗肿瘤药物和免疫调节剂(ATC=L),两种被分类为神经***(ATC=N),而其余包括以下之一:血液和造血器官(ATC=B)、肌肉骨骼***(ATC=M)、感觉器官(ATC=S)以及消化道和新陈代谢(ATC=A)。已完成或处于招募阶段的精神***症临床试验登记了其中三种化合物——甘氨酸、伐尼克兰和艾塞那肽。
表5.富集精神***症常见多基因风险的每个途径的成员之间的最高置信度药物相互作用
Figure BDA0003490393760000311
*在DGidb v3.02的每个途径中通过与基因的最高置信度相互作用得分选择的药物(分类为TClin)。#肌肉松弛剂。
使用WebGestalt中的过度表示分析获得了靶向每个途径中统计上显著数量的基因的药物。在测试的八个基因集中,六个具有显著的药物富集,经过多次测试校正后三个基因的重叠最少(表6、表7)。神经***药物是所有输入途径中最常见的ATC类别(1级)。这与抗癫痫药物靶标中精神***症相关常见变体富集的文献报道一致(Gaspar et al.,2017,Scientific Reports,7:12460)。病症先前临床试验的一些有趣的重新利用候选物包括靶向NOS1途径的精神***Atomoxiene(Kelly et al,2009,Journal of ClinicalPsychiatry,70:518-525)、α4β2烟碱乙酰胆碱受体亚型部分激动剂伐尼克兰(Smith etal.,2016,Plos One,11:e0143490-e0143490)和抗坏血酸(维生素C;Dakhale et al.,2005,Psychopharmacology(Berlin),182:494-498)。虽然这些试验的结果好坏参半,但基于基因组风险针对特定个体的此类干预尚待研究。
表6.每种药源富集得分途径的前富集药物靶标,其在多次测试校正后具有至少三个相互作用基因
Figure BDA0003490393760000321
*多次检验校正后最显著相关的药物,当校正后的P值相等时,选择基因集重叠度最高的药物。#候选途径中药物靶向的基因数量。
表7.每种药源富集得分途径的富集靶标,其在多次测试校正后具有至少三个相互作用基因
Figure BDA0003490393760000322
Figure BDA0003490393760000331
Figure BDA0003490393760000341
Figure BDA0003490393760000351
Figure BDA0003490393760000361
Figure BDA0003490393760000371
实施例4
在精神***症队列中药源富集得分个体分析
在这项研究中,实施了一个分层***来定义具有临床可操作基因组中高PES得分的队列成员。首先,检查了ASRB队列中靠前百分位数的个体,以高置信度探索风险得分升高的表型特征。有55人具有靠前百分位数PES,因为一例精神***症病例在叶酸的一碳库和GABA合成、释放、再摄取和降解途径中的PES均升高。从这个子集,大多数是精神***症患者(N=38),但是,靠前百分位状态与诊断之间没有显著关联(z=0.975,P=0.33)。对ASRB参与者获得的临床特征进行了调查,以优先考虑可能从个性化治疗方案中受益最多的靠前百分位数PES携带者。选择了三个变量作为病症的更具临床挑战性的表现的代表:氯氮平处方(作为治疗抗性的替代指标)、全球功能评估(GAF)得分<50以及在18岁之前发病的青少年。有趣的是,在38例PES升高的精神***症病例中,该子集中有71%至少满足以下标准之一(N=27):氯氮平处方(N=9),GAF<50(N=12),发病年龄<18(N=9)。
此外,实施了两个不太严格的高PES分区,具体而言;整个队列中PES的十分位数和四分位数截止值用于分类该途径中功能障碍风险升高的患者。个体在靠前十分位数或四分位数中的最高PES数分别为六(图5)。靠前四分位数(P=0.0287,OR=1.1493[95%CI:1.016–1.303])和十分位数(P=0.0384,OR=1.207[95%CI:1.013–1.447])的PES数量增加与精神***症相关。然而,这个信号在PRS总和调整后并不显著。如图6中的核密度估计所见,有证据表明那些具有至少四个靠前四分位数或十分位数PES分数的个体偏向高PRS总和。虽然本研究的目的不是发现与该队列病例的关联,但在ASRB-胰岛素分泌调节(z=2.262,P=0.0237)和乙酰胆碱结合和下游事件途径(z=2.167,P=0.0303)中,两种PES名义上与精神***症相关。然而,当对总精神***症PRS(PRS总和,P>0.05)共变时消除了显著性。
实施例5
基于途径的注释与精神***症全基因组多基因风险之间的关系每个得分之间的成对相关性表明在任何PES之间或与PRS总和之间没有显著的单变量关系(图6)。此外,与队列其他部分相比,靠前百分位数PES个体未富集PRS总和:z=0.819,P=0.413(图6)。这提出了具有临床意义的精神***症病例子集,其多基因表型较少,即PRS总和相对于精神***症队列是低的,但在一种或多种途径中遗传风险高。在ASRB精神***症队列中PRS总和的靠后四分位数分析揭示靠前百分位数PES但PRS总和耗尽的病例(N=10)。这些个体中包含的途径是乙酰胆碱(N=3)、Hedgehog信号传导(N=2)、Sema3A中的CRMPs(N=2)、GABA(N=1)、HIF-2(N=1)和胰岛素分泌(N=1)。该信息可能具有很大的临床价值,因为这些病例在全基因组范围内的常见变体负担不太明显,但在基因集中存在局部风险。此外,这些患者中三名患者服用了氯氮平(替代治疗抗性),另外三名整体功能低下(GAF<50),以及两个青少年发病病例-可能突出了这些个体对精确干预的需求增加。
为了研究低多基因负担和PES升高之间的关系,在精神***症队列中,使用有限高斯混合建模(GMM),对全基因组PRS和每个个体的靠前十分位数中的PES计数进行聚类。基于使用贝叶斯信息准则(BIC)的协方差矩阵的参数化选择最佳聚类数,其中最高BIC值用于选择聚类数(图7)。从数据中得出四个聚类(BIC=13871.21,VEV:可变体积、相等形状、可变方向)(图7)。聚类是椭球体,椭球体的体积、密度等高线的形状和相应椭球体的方向也由协方差矩阵决定。前两个聚类包括在ASRB队列的靠前十分位数中至少有一个PES的精神***症患者,聚类1的PRS总和相对于聚类2低。第三和第四聚类的PES没有升高,但聚类3代表患者具有比聚类4更大的多基因负担,即PRS总和。在聚类1中PRS总和的分布强化了这样的概念,即具有较低多基因风险的精神***症患者的一个子集可在一个或多个特定的生物***中集中升高。类似于它与PRS总和的单变量关系,相对于最大的聚类,聚类2,在GMM聚类的任一个中没有富集在ARSB队列的靠前百分位数中具有极值PES的个体(聚类2vs聚类1:P=0.668;聚类2vs聚类3:P=0.492;聚类2vs聚类4:P=0.977)。
实施例6
富集I型糖尿病常见变体风险的临床可操作途径
我们对一队列I型糖尿病患者(N=9934)中的PES进行了分析,并从Bradford等人汇编的全基因组SNP数据集(PloS Genetics,2011,7(9):e1002293)的荟萃分析中筛选了健康对照(N=16956)。在四个PT(PT<1、PT<0.5、PT<0.05、PT<0.005)的过滤路径上进行基因集关联。最显著相关的基因组是ABC转运蛋白(P=5.82x10-10,β=2.01,SE=0.329,PT<0.005)。在表8中提供了在评估的每个PT处最显著的基因集。
表8.在每个PT处富集I型糖尿病相关常见变异的最高临床可操作途径
Figure BDA0003490393760000401
对于每个基因集,最高置信度的靶点-药物相互作用(FDA批准)来自DGIdb v3.0.2(表9)。指示用于治疗其他自身免疫性疾病(包括类风湿性关节炎)的免疫抑制剂阿巴西普是两种途径(IgA产生和ABC转运蛋白)的最可靠相互作用。II型糖尿病药物格列本脲被优先用于ABC转运***。使用WebGestalt中的过度表示分析获得了靶向每个途径中统计上显著数量的基因的药物。在多次测试校正后,这些基因集中的两个至少有一个具有统计学意义的药物靶标过度表示,其中格列本脲再次优先用于ABC转运蛋白途径(表10)。
表9.富集I型糖尿病常见多基因风险的每个途径的成员之间的最高置信度药物相互作用
Figure BDA0003490393760000411
表10.每种药源富集得分途径的前富集药物靶标,其在多次测试校正后具有至少三个相互作用基因
Figure BDA0003490393760000412
*重叠是指候选途径中药物靶向的基因数量。
实施例7
富集重度抑郁症常见变体风险的临床可操作途径
重度抑郁症(MDD)是一种以持续性抑郁情绪为特征的神经精神综合征。我们使用来自精神病基因组学联盟2018mega-GWAS(Wray et al.,2018,Nature Genetics,50(5):668-681)的全基因汇总统计,分析MDD患者队列(N=135,458)和筛选的健康对照(N=344,901)中的PES。在四个PT(PT<1、PT<0.5、PT<0.05、PT<0.005)的过滤路径上进行基因集关联。最显著相关的基因集是阿巴卡韦转运和代谢(P=3.81x10-5,β=0.605,SE=0.0178,PT<0.005)。在表11中提供了在评估的每个PT处最显著的基因集。
表11.在每个PT处富集MDD相关常见变异的最高临床可操作途径
Figure BDA0003490393760000421
DGIdb衍生的每个候选途径的药物-基因相互作用导致两种蛋白激酶抑制剂(达沙替尼和威罗非尼)和两种免疫相关药物(西妥昔单抗和利巴韦林)的优先使用(表12)。使用WebGestalt中的过度表示分析获得了靶向每个途径中统计上显著数量的基因的药物。其中三个基因集具有至少一种统计学上显著的多基因/药物相互作用(表13)。
表12.富集MDD常见多基因风险的每个途径的成员之间的最高置信度药物相互作用
Figure BDA0003490393760000422
表13.每种药源富集得分途径的前富集药物靶标,其在多次测试校正后具有至少三个相互作用基因
Figure BDA0003490393760000423
实施例8
富集多发性硬化症常见变体风险的临床可操作途径
我们使用由Wellcome Trust Case Control Consortium 2(WTCCC2)和International Multiple Sclerosis Genetics Consortium(IMSGC)(Nature,2011,47(7359):214-219)制作的公开可用的全基因组汇总统计,分析多发性硬化患者队列(N=9772)和筛选的健康对照(N=17376)中的PES。在四个PT(PT<1、PT<0.5、PT<0.05、PT<0.005)的过滤路径上进行基因集关联。最显著相关的基因集是还原型谷胱甘肽代谢途径(P=1.15x10-17,β=4.44,SE=0.121,PT<0.005)。在表14中提供了在评估的每个PT处最显著的基因集。
表14.在每个PT处富集多发性硬化症相关常见变异的最高临床可操作途径
Figure BDA0003490393760000431
DGIdb衍生的每个候选途径的药物-基因相互作用导致四种远程药物(distantdrug)的优先使用(表15)。使用WebGestalt中的过度表示分析获得了靶向每个途径中统计上显著数量的基因的药物。所有药物都具有至少一种统计学上显著的多基因/药物相互作用,其中排名靠前的药物具有免疫关系(表16)。
表15.富集MDD常见多基因风险的每个途径的成员之间的最高置信度药物相互作用
Figure BDA0003490393760000432
表16.每种药源富集得分途径的前富集药物靶标,其在多次测试校正后具有至少三个相互作用基因
Figure BDA0003490393760000441
讨论
从精神***症GWAS到具有已知药物相互作用的生物学途径中的常见变异的聚集揭示了与八种不同PES得分相关的多种***。这些候选途径在PT范围内显示出常见的变异富集,表示多基因性的程度,范围从使用所有SNP作为输入,到显著性阈值低于0.005(PT<0.005)。虽然其中两种途径包括GABAergic和胆碱能神经传递,这两种途径都是直观的候选者,与精神***症相关的药物已经广泛涉及到神经精神疾病的常见实践,但许多其他途径更令人惊讶。最显著相关的基因集与HIF-2转录因子网络有关,该网络是响应可用细胞氧减少的重要介质。这对涉及精神疾病的生物学机制具有明显的意义,例如多巴胺能信号传导。从治疗的角度来看,该途径中抗坏血酸(维生素C)靶标的富集是值得注意的,因为它具有抗氧化能力,以及其作为辅助治疗疾病的功效的初步证据。HIF-2信号传导和NOS1信号传导之间的相互作用是精神***症中另一种具有药物富集的候选途径,得到了该病症中氧化还原功能障碍的先前证据的支持(Olson et al.,2011,Nitric Oxide:Biology andChemistry/Official Journal of the Nitric Oxide Society,25:125-137)。NOS1***中谷氨酸受体的活性表明精神抑制药和精神兴奋药可能调节该途径。发明人还观察到两种可以药理学调节的发育途径中的常见变体富集:semaphorin 3a信号传导和Hedgehog信号传导中的CRMP。前者能够与酪氨酸激酶抑制剂达沙替尼相互作用,这被假定具有神经保护特性(Wrasidlo et al.,2014,British Journal of Pharmacology,171:5757-5773)。这些可操作途径的富集与导致精神***症病因学的神经发育缺陷的长期假设一致(Rapoport etal.,2012,Molecular Psychiatry,17:1228-1238)。
靶向这些用于构建PES的途径的药物的广度表明,个体水平的治疗制剂可以变得高度特异性,这取决于基因组风险定位于哪个***。这将包括使用先前在未分化精神***症队列中测试的化合物进行精确治疗的个体分层,包括维生素C、Atomoxiene和伐尼克兰,这些化合物在本研究中使用PES鉴定。为了解其遗传责任的个体重新利用药物可能有助于减少反应异质性,这阻碍了在精神***症等非常复杂的表型中实施新疗法。PES在任何途径的靠前百分位数中的个体,特别是具有低全基因组PRS的那些,是这种方法最容易处理的候选者;仅由总PRS索引的未注释的全基因组关联将错过特定组的常见变体负担的临床意义。
我们的方法在其他复杂病症中得到进一步验证,包括I型糖尿病、MDD和多发性硬化症。在每种疾病中,从GWAS到具有已知药物相互作用的生物学途径中的常见变异的聚集揭示了与不同PES得分相关的多种***。这些候选途径在PT范围内显示出常见的变异富集,表示多基因性的程度,范围从使用所有SNP作为输入,到显著性阈值低于0.005(PT<0.005)。这些数据表明,PES方法可以提供一种机制来整合个体的常见变体风险,从而为诸如精神***症、I型糖尿病、MDD和多发性硬化症等复杂病症的个性化干预提供信息,包括药物再利用。

Claims (20)

1.一种用于治疗人类受试者的复杂病症的方法,包括:
a.鉴定一种或多种药理学相关的生物学途径,其包括以下步骤:
i.从多个患有所述复杂病症的个体和多个没有所述复杂病症的个体获得代表全基因组变体的数据;
ii.选择与所述复杂病症显著相关的多组变体,其中每组变体使用多个P值阈值(PT)鉴定;
iii.对所述多组变体中的每一个进行基因集关联分析,以鉴定富含与所述复杂病症显著相关的变体的基因集;
iv.对于每个鉴定出的基因集,生成对应于多个预定义注释类别的多个注释,其中所述多个预定义注释类别包括生物途径注释类别、药物靶标注释类别和治疗剂注释类别;
v.鉴定一种或多种药理学相关生物学途径,其中所述药理学相关生物学途径包括注释的生物学途径、注释的药物靶标和至少一种注释的治疗剂;和
b.选择用于治疗受试者的所述复杂病症的治疗剂,其包括以下步骤:
i.从受试者获得代表生物样品中全基因组变体的数据;
ii.使用步骤(a)(ii)中的所述多个PT的每一个,从受试者的全基因组变体数据,计算步骤(a)(v)中鉴定的所述药理学相关生物学途径的预测性多基因得分;和
iii.从所述复杂病症的治疗中选择至少一种治疗剂,其中相对于参考值升高的预测性多基因得分表明所述受试者可能对至少一种注释的治疗剂敏感,
c.用选择的治疗剂治疗所述受试者。
2.一种用于在处于发展复杂病症风险的受试者中预防所述复杂病症的方法,包括:
a.鉴定一种或多种药理学相关的生物学途径,其包括以下步骤:
i.从多个患有所述复杂病症的个体和多个没有所述复杂病症的个体获得代表全基因组变体的数据;
ii.选择与所述复杂病症显著相关的多组变体,其中每组变体使用多个P值阈值(PT)鉴定;
iii.对所述多组变体中的每一个进行基因集关联分析,以鉴定富含与所述复杂病症显著相关的变体的基因集;
iv.对于每个鉴定出的基因集,生成对应于多个预定义注释类别的多个注释,其中所述多个预定义注释类别包括生物途径注释类别、药物靶标注释类别、治疗剂注释类别、膳食补充剂注释类别和生活方式干预注释类别;和
v.鉴定一种或多种药理学相关生物学途径,其中所述药理学相关生物学途径包括注释的生物学途径和注释的药物靶标;
b.选择预防性治疗以预防所述复杂病症的发展,其包括以下步骤:
i.从受试者获得代表生物样品中全基因组变体的数据;
ii.使用步骤(a)(ii)中的所述多个PT的每一个,从受试者的全基因组变体数据,计算步骤(a)(v)中鉴定的所述药理学相关生物学途径的预测性多基因得分;和
iii.将受试者鉴定为处于发展复杂病症的风险中,其中相对于参考值升高的预测性多基因得分表明受试者可能处于发展所述复杂病症的风险中,其中具有相对于参考值升高的预测性多基因得分的药理学相关生物学途径具有选自治疗剂注释、膳食补充剂注释和生活方式干预注释的至少一个附加注释,以及
c.用一种或多种注释的治疗剂、膳食补充剂或生活方式干预治疗所述受试者以防止所述复杂病症的发展。
3.根据权利要求1或权利要求2所述的方法,其中所述代表全基因组变体的数据选自单核苷酸多态性(SNP)基因型数据、拷贝数变体(CNV)数据、基因缺失数据、基因倒位数据、基因重复数据、剪接变体数据、单倍型数据或其组合。
4.根据权利要求3所述的方法,其中所述代表全基因组变体的数据是SNP基因型数据。
5.根据权利要求1或权利要求2所述的方法,其中所述代表全基因组变体的数据是全基因组关联研究(GWAS)汇总统计。
6.根据权利要求1或权利要求2所述的方法,其中所述变体选自与复杂病症相关的常见SNP、CNV、基因缺失、基因倒位、基因复制、剪接变体和单倍型。
7.根据权利要求6所述的方法,其中所述变体是SNP。
8.根据权利要求1至7中任一项所述的方法,其中至少一个PT识别与所述复杂病症相关的所有变体。
9.根据权利要求1至8中任一项所述的方法,其中所述复杂病症选自糖尿病、多发性硬化症、精神***症、双相情感障碍、注意力缺陷多动障碍、重度抑郁症、强迫症、进食障碍、炎性病症、自身免疫病症、代谢紊乱、心血管疾病和癌症。
10.根据权利要求9所述的方法,其中所述复杂病症选自糖尿病、多发性硬化症、精神***症、双相情感障碍、注意力缺陷多动障碍、重度抑郁症、强迫症和进食障碍。
11.根据权利要求10所述的方法,其中所述复杂病症是精神***症。
12.根据权利要求1至11中任一项所述的方法,其中所述预定义生物途径注释类别来源于分子特征数据库(MSigDB)。
13.根据权利要求1至12中任一项所述的方法,其中所述预定义药物靶标注释类别来源于靶标中央资源数据库(TCRD)。
14.根据权利要求1至13中任一项所述的方法,其中所述预定义治疗剂注释类别来源于DrugCentral数据库。
15.根据权利要求1至14中任一项所述的方法,其中所述基因集关联分析包括将变体映射到蛋白质编码基因。
16.根据权利要求15所述的方法,其中所述变体被映射在所述蛋白质编码基因上游约5kb和下游约1.5kb内。
17.根据权利要求16所述的方法,其中不包括映射到主要组织相容性复合体(MHC)区域内的蛋白质编码基因的变体。
18.根据权利要求1至17中任一项所述的方法,其中一种或多种药理学相关生物学途径的鉴定进一步包括每个基因集的富集分析,以及过度表示分析。
19.一种基于计算机的基因组注释***,其包括被配置为存储指令的非暂时性存储器和与所述存储器耦合的至少一个处理器,所述处理器被配置为:
a.从多个患有复杂病症的个体和多个没有复杂病症的个体接收全基因组变体数据;
b.处理所述全基因组变体数据以选择与所述复杂病症显著相关的多组变体,其中每组变体使用多个P值阈值(PT)鉴定;
c.对所述多组变体中的每一个进行基因集关联分析,以鉴定富含与所述复杂病症显著相关的变体的基因集;
d.对于每个鉴定出的基因集,生成对应于多个预定义注释类别的多个注释,其中所述多个预定义注释类别包括生物途径注释类别、药物靶标注释类别和批准治疗剂注释类别;和
e.鉴定一种或多种药理学相关生物学途径,其中所述药理学相关生物学途径包括注释的生物学途径、注释的药物靶标和至少一种注释的批准治疗剂。
20.根据权利要求19所述的基于计算机的基因组注释***,其还包括单独的计算方法以询问个体受试者的基因型以选择适合于治疗复杂病症的药剂,该方法包括:
a.从受试者的生物样品中接收全基因组变体数据;
b.使用所述多个PT的每一个,从受试者的全基因组变体数据,计算所述药理学相关生物学途径的预测性多基因得分;和
c.从所述复杂病症的治疗中选择至少一种治疗剂,其中相对于参考值升高的对于每个PT计算的预测性多基因得分表明所述受试者可能对至少一种注释的治疗剂敏感。
CN202080055551.1A 2019-05-30 2020-05-29 治疗或预防方法 Pending CN114514329A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2019901861 2019-05-30
AU2019901861A AU2019901861A0 (en) 2019-05-30 A method of treatment or prophylaxis
PCT/AU2020/050540 WO2020237314A1 (en) 2019-05-30 2020-05-29 A method of treatment or prophylaxis

Publications (1)

Publication Number Publication Date
CN114514329A true CN114514329A (zh) 2022-05-17

Family

ID=73552144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080055551.1A Pending CN114514329A (zh) 2019-05-30 2020-05-29 治疗或预防方法

Country Status (6)

Country Link
US (1) US20220172811A1 (zh)
EP (1) EP3976829A4 (zh)
CN (1) CN114514329A (zh)
AU (1) AU2020285475A1 (zh)
CA (1) CA3141888A1 (zh)
WO (1) WO2020237314A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220172811A1 (en) * 2019-05-30 2022-06-02 The University Of Newcastle A method of treatment or prophylaxis

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023168499A1 (en) * 2022-03-08 2023-09-14 PolygenRx Pty Ltd A method of precision treatment

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010039526A1 (en) * 2008-09-23 2010-04-08 Indiana University Research And Technology Corporation Genes and single nucleotide polymorphisms for genetic testing in bipolar disorder
CN102177436A (zh) * 2008-08-12 2011-09-07 金帆德尔制药股份有限公司 鉴定疾病风险因子的方法
CN102803509A (zh) * 2009-10-07 2012-11-28 弗·哈夫曼-拉罗切有限公司 用于治疗、诊断和监控狼疮的方法
WO2013006857A1 (en) * 2011-07-07 2013-01-10 The Children's Hospital Of Philadelphia Genetic alterations associated with autism and the autistic phenotype and methods of use thereof for the diagnosis and treatment of autism
WO2013055683A1 (en) * 2011-10-10 2013-04-18 Teva Pharmaceutical Industries Ltd. Single nucleotide polymorphisms useful to predict clinical response for glatiramer acetate
US20130166320A1 (en) * 2011-09-15 2013-06-27 Nextbio Patient-centric information management
WO2014110350A2 (en) * 2013-01-11 2014-07-17 Oslo Universitetssykehus Hf Systems and methods for identifying polymorphisms
US20180330824A1 (en) * 2017-05-12 2018-11-15 The Regents Of The University Of Michigan Individual and cohort pharmacological phenotype prediction platform
CN109310332A (zh) * 2016-04-07 2019-02-05 怀特安维创新有限责任公司 用于分析数字数据的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018075332A1 (en) * 2016-10-18 2018-04-26 Arizona Board Of Regents On Behalf Of The University Of Arizona Pharmacogenomics of intergenic single-nucleotide polymorphisms and in silico modeling for precision therapy
US20220172811A1 (en) * 2019-05-30 2022-06-02 The University Of Newcastle A method of treatment or prophylaxis

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102177436A (zh) * 2008-08-12 2011-09-07 金帆德尔制药股份有限公司 鉴定疾病风险因子的方法
WO2010039526A1 (en) * 2008-09-23 2010-04-08 Indiana University Research And Technology Corporation Genes and single nucleotide polymorphisms for genetic testing in bipolar disorder
CN102803509A (zh) * 2009-10-07 2012-11-28 弗·哈夫曼-拉罗切有限公司 用于治疗、诊断和监控狼疮的方法
WO2013006857A1 (en) * 2011-07-07 2013-01-10 The Children's Hospital Of Philadelphia Genetic alterations associated with autism and the autistic phenotype and methods of use thereof for the diagnosis and treatment of autism
US20130166320A1 (en) * 2011-09-15 2013-06-27 Nextbio Patient-centric information management
WO2013055683A1 (en) * 2011-10-10 2013-04-18 Teva Pharmaceutical Industries Ltd. Single nucleotide polymorphisms useful to predict clinical response for glatiramer acetate
WO2014110350A2 (en) * 2013-01-11 2014-07-17 Oslo Universitetssykehus Hf Systems and methods for identifying polymorphisms
CN109310332A (zh) * 2016-04-07 2019-02-05 怀特安维创新有限责任公司 用于分析数字数据的方法
US20180330824A1 (en) * 2017-05-12 2018-11-15 The Regents Of The University Of Michigan Individual and cohort pharmacological phenotype prediction platform

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ANA MÁRQUEZ等: "Meta-analysis of Immunochip data of four autoimmune diseases reveals novel singledisease and cross-phenotype associa", GENOME MEDICINE, vol. 10, no. 97, pages 1 - 13 *
LOUISE V WAIN等: "Genome-wide association analyses for lung function and chronic obstructive pulmonary disease identify new loci and potential druggable targets", NATURE GENETICS, vol. 49, pages 416 - 425, XP093038615, DOI: 10.1038/ng.3787 *
张军英;: "全基因组关联分析的研究现状及对数据科学的挑战", 广州大学学报(自然科学版), no. 01, pages 5 - 13 *
田艳君;刘传新;刘海青;白波;: "抑郁症全基因组关联分析的研究进展", 中华诊断学电子杂志, no. 02, pages 74 - 77 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220172811A1 (en) * 2019-05-30 2022-06-02 The University Of Newcastle A method of treatment or prophylaxis

Also Published As

Publication number Publication date
EP3976829A4 (en) 2023-07-12
EP3976829A1 (en) 2022-04-06
WO2020237314A1 (en) 2020-12-03
AU2020285475A1 (en) 2021-12-23
CA3141888A1 (en) 2020-12-03
US20220172811A1 (en) 2022-06-02

Similar Documents

Publication Publication Date Title
Smeland et al. The polygenic architecture of schizophrenia—rethinking pathogenesis and nosology
Demontis et al. Discovery of the first genome-wide significant risk loci for attention deficit/hyperactivity disorder
Schizophrenia Working Group of the Psychiatric Genomics Consortium et al. Mapping genomic loci prioritises genes and implicates synaptic biology in schizophrenia
Zhang et al. Epigenome-wide meta-analysis of DNA methylation differences in prefrontal cortex implicates the immune processes in Alzheimer’s disease
Shen et al. Genetic analysis of quantitative phenotypes in AD and MCI: imaging, cognition and biomarkers
Li et al. Allelic differences between Europeans and Chinese for CREB1 SNPs and their implications in gene expression regulation, hippocampal structure and function, and bipolar disorder susceptibility
Mo et al. MicroRNA expressing profiles in A53T mutant alpha-synuclein transgenic mice and Parkinsonian
Wells et al. The anatomical distribution of genetic associations
Li et al. Further confirmation of netrin 1 receptor (DCC) as a depression risk gene via integrations of multi-omics data
Kalsi et al. Genome-wide association of heroin dependence in Han Chinese
Frenkel et al. Genome-wide analysis identifies rare copy number variations associated with inflammatory bowel disease
Ursini et al. Prioritization of potential causative genes for schizophrenia in placenta
WO2023168499A1 (en) A method of precision treatment
CN114514329A (zh) 治疗或预防方法
Bakker et al. Linking common and rare disease genetics through gene regulatory networks
Toikumo et al. A multi-ancestry genetic study of pain intensity in 598,339 veterans
Han et al. Integrated co-expression network analysis uncovers novel tissue-specific genes in major depressive disorder and bipolar disorder
Ge et al. Genetic architectures of cerebral ventricles and their overlap with neuropsychiatric traits
Li et al. The genetic variants in 3’untranslated region of voltage-gated sodium channel alpha 1 subunit gene affect the mRNA-microRNA interactions and associate with epilepsy
Shen et al. Comparative analysis of the autism‑related variants between different autistic children in a family pedigree
Chai et al. Identification of a thymus microRNA‑mRNA regulatory network in Down syndrome
Bergen et al. Summaries from the XVIII World Congress of Psychiatric Genetics, Athens, Greece, 3–7 October 2010
Maselli et al. Computational analysis of five neurodegenerative diseases reveals shared and specific genetic loci
Guo et al. Behavioural deficits of autism spectrum disorder and associations with different gene clusters: a study with the whole-genome transmission disequilibrium test
Zhan Identification of rare-variant effect in complex human traits using whole-genome and whole-exome sequencing data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination