CN109863251B - 对肺鳞状细胞癌亚型分型的方法 - Google Patents

对肺鳞状细胞癌亚型分型的方法 Download PDF

Info

Publication number
CN109863251B
CN109863251B CN201780044228.2A CN201780044228A CN109863251B CN 109863251 B CN109863251 B CN 109863251B CN 201780044228 A CN201780044228 A CN 201780044228A CN 109863251 B CN109863251 B CN 109863251B
Authority
CN
China
Prior art keywords
expression
sample
subtype
classifier
biomarkers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780044228.2A
Other languages
English (en)
Other versions
CN109863251A (zh
Inventor
H·法鲁基
M·莱-高德曼
G·梅休
J·赛罗德
C·佩鲁
D·N·海耶斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of North Carolina at Chapel Hill
Genecentric Diagnostics Inc
Original Assignee
University of North Carolina at Chapel Hill
Genecentric Diagnostics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of North Carolina at Chapel Hill, Genecentric Diagnostics Inc filed Critical University of North Carolina at Chapel Hill
Publication of CN109863251A publication Critical patent/CN109863251A/zh
Application granted granted Critical
Publication of CN109863251B publication Critical patent/CN109863251B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/81Protease inhibitors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Toxicology (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Veterinary Medicine (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Cell Biology (AREA)
  • Medical Informatics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)

Abstract

提供了用于通过检测选自一组肺鳞状细胞癌基因标签的至少一种分类器生物标记物的表达水平来确定个体的肺鳞状细胞癌(SQ)亚型的方法和组合物。本文还提供了用于确定具有一种鳞状细胞癌亚型的个体对诸如免疫疗法等疗法的反应的方法和组合物。

Description

对肺鳞状细胞癌亚型分型的方法
交叉引用
本申请要求2016年5月17日提交的美国临时申请号62/337,645、2016年8月25日提交的美国临时申请号62/379,402、2016年9月19日提交的美国临时申请号62/396,587、2016年11月11日提交的美国临时申请号62/420,836和2016年11月23日提交的美国临时申请号62/425,717的优先权,出于所有目的将每个临时申请通过引用以其整体并入本文。
技术领域
本发明涉及用于确定肺样品的鳞状细胞癌亚型和用于预测患有特定肺癌类型的患者对治疗的反应的方法。
关于序列表的声明
与本申请相关的序列表以文本格式提供以代替纸质拷贝,并且通过引用特此并入本说明书中。包含该序列表的文本文件的名称是GNCN_010_01WO_SeqList_ST25.txt。文本文件为319KB,并且创建于2017年5月16日,并通过EFS-Web以电子方式提交。
发明背景
肺癌是美国以及全世界癌症死亡的主要原因。2005年诊断出大约172,000例肺部肿瘤,估计有163,000例死亡,超过结肠、乳腺和***癌症的总和。至少75%的患者出现局部晚期疾病。尽管已经作出很多努力来使用诸如高分辨率CT等技术改进筛查,但这些方法通常会产生假阳性结果,并且通常不会改变结果。因此,即使是早期检测到的小肿瘤也对于如下患者构成重大威胁,该患者的I期肺癌术后5年存活率估计在47%至63%之间。对于晚期疾病患者,预后较差,中值存活期低于一年。一般而言,姑息治疗有效但不可持续,并且对总体存活期的平均影响为大约3个月。
在群体水平上,肺癌的根本原因显然是烟草使用,其中全部肺癌中的90%直接归因于吸烟。吸烟与肺癌如此紧密相关,以致于它击败与大多数其他危险因素的决定性联系;虽然石棉、氡和一些肺部刺激物通常被认为是肺癌的危险因素。强烈怀疑遗传联系,然而,确切的机制仍然被确定在罕见的孟德尔癌症综合征选定组之外。尽管有许多分类方案和正在进行的临床试验,但在临床诊断和治疗领域总体上取得了令人失望的进展。
存在四种不同的固有的肺鳞状细胞癌亚型,它们在基因组谱方面不同,包括基因表达、突变谱和拷贝数改变。这四种生物肺鳞状细胞癌亚型(即原发型、经典型、分泌型和基底型)不仅在它们的基因组特征上不同,而且在临床特征上也显示出潜在的重要差异。
大多数肺癌被归类为非小细胞肺癌(NSCLC)(>85%),其是一个多样化的组,在整个呼吸道中都有亚型。腺癌(AD)和鳞状细胞癌(SCC或SQ)是NSCLC的两个主要亚型,其诊断频率几乎相等,但常常在不同位置被发现,SCC出现在更中心的位置。由世界卫生组织(WHO)开发的第6版肺癌共识分类(consensus classification of lung cancers)描述了不少于90种恶性形态类别和变体。通常可能存在异质性,尤其是在>1.5cm的较大肿瘤中,使得形态学分类更加困难并且导致诸如腺癌-鳞状细胞癌等命名。此外,组织学诊断再现性的研究已经表明病理学家内一致性和病理学家间一致性有限。形态学的变化性、有限的组织样品以及对不断增加的治疗靶向标记物列表评估的需要对当前的诊断标准提出了挑战。如下观点进一步突出了这一点:肺癌的各种形态学亚型之间的区分在指导患者管理方面是必不可少的并且可以使用另外的分子测试来鉴定特定的治疗靶标记物。
目前,基于基因表达的肺鳞状细胞癌(SQ)亚型分型主要限于如下研究方案,该研究方案涉及从新鲜冷冻肺肿瘤中提取RNA,随后使用超过200种基因的定量基因表达来应用最近质心(nearest centroid)预测因子,如Wilkerson等人Clin Cancer Res 2010;16(19):4864-75中所述,将该文献通过引用以其整体并入本文。已经显示基于基因表达的SQ亚型将鳞状细胞癌肿瘤分为4种生物学上不同的亚型,即基底型、经典型、原发型和分泌型。此外,这四种亚型可能在存活结果、患者群体、生物过程和免疫原应答方面不同。尽管有SQ亚型分型的预后和预测益处的证据,但是对于>200种基因的基因表达的需求结合复杂的生物信息学分析,阻碍了SQ亚型分型在药物开发和/或临床中的应用。
癌症免疫监视的原则是免疫***可以鉴定癌前细胞和癌性细胞,并在这些细胞变成临床相关性之前杀死它们,这已经在免疫缺陷小鼠模型中得到证明。先天性和适应性免疫反应可以一起工作以促进或抑制癌症生长,并且逃避免疫破坏是癌症的新兴标志。在历史上,免疫刺激的方法对于临床上的肺癌患者无效。肿瘤抗原表达的缺陷和抗原呈递细胞(APC)的呈现,免疫抑制细胞和细胞因子的浸润以及无效的T细胞活化可以导致在肿瘤部位的免疫抑制。对癌症和免疫***的理解的进展已经导致有效的疗法,该疗法激活抗肿瘤反应,甚至在已经高度发展免疫逃避方法的肿瘤(例如肺癌)中。然而,由于患者中免疫激活和免疫抑制之间的微妙平衡,由肺部肿瘤引起的高免疫抑制作用限制了这些进展的有益效果。例如,在NSCLC中,阻碍免疫激活的免疫抑制细胞的作用很高,这被认为与肿瘤的类型、疾病的进展期和肿瘤负荷有关。
因此,开发一种有效区分固有的肺鳞状细胞癌亚型的方法对临床诊断和疾病管理至关重要。因此,需要新的方法来进一步确定可能对免疫疗法有反应的群体。本发明部分地解决了本领域中对基于患者的SQ亚型(基底型、经典型、原发型、分泌型)来确定SQ患者群体的预后或疾病结果的这些和其他需求。与本领域已知的诊断方法相比,本发明的方法提供了用于确定肺癌的细胞和分子起源(例如,对SQ亚型分型)的手段,并且可以提供更准确的诊断和可应用的治疗。
发明概述
在一个方面,本文提供了用于确定从患者获得的肺组织样品的鳞状细胞癌(SQ)亚型的方法,该方法包括检测表1的至少一种分类器生物标记物的表达水平,其中该分类器生物标记物的表达水平的检测特异性地鉴定基底、经典、分泌或原发SQ亚型。在一些情况下,该方法还包括将检测到的表1的该至少一种分类器生物标记物的表达水平与至少一个样品训练集中的表1的该至少一种分类器生物标记物的表达进行比较,其中该至少一个样品训练集包含来自参考基底型SQ样品的表1的该至少一种分类器生物标记物的表达数据、来自参考经典型SQ样品的表1的该至少一种分类器生物标记物的表达数据、来自参考分泌型SQ样品的表1的该至少一种分类器生物标记物的表达数据、来自参考原发型SQ样品的表1的该至少一种分类器生物标记物的表达数据或其组合;并且基于比较步骤的结果将样品分类为基底、经典、分泌或原发亚型。在一些情况下,比较步骤包括应用统计算法,该统计算法包括确定从样品获得的表达数据与来自该至少一个训练集的表达数据之间的相关性;并且基于统计算法的结果将样品分类为基底、经典、分泌或原发亚型。在一些情况下,在核酸水平检测分类器生物标记物的表达水平。在一些情况下,核酸水平是RNA或cDNA。在一些情况下,对表达水平的检测包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。在一些情况下,通过进行qRT-PCR检测表达水平。在一些情况下,对表达水平的检测包括使用对表1的至少一种分类器生物标记物有特异性的至少一对寡核苷酸引物。在一些情况下,样品是从患者获得的***固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,该至少一种分类器生物标记物包含多种分类器生物标记物。在一些情况下,该多种分类器生物标记物包含表1的至少两种分类器生物标记物、至少10种分类器生物标记物、至少20种分类器生物标记物、至少30种分类器生物标记物、至少40种分类器生物标记物、至少50种分类器生物标记物、至少60种分类器生物标记物、或至少70种分类器生物标记物。在一些情况下,该至少一种分类器生物标记物包含表1的所有分类器生物标记物。
在另一个方面,本文提供了用于确定从患者获得的肺组织样品的鳞状细胞癌(SQ)亚型的方法,该方法包括检测编码在肺癌细胞中具有特定表达模式的分类器生物标记物的至少一种核酸分子的表达水平,其中该分类器生物标记物选自下组,该组由表1中列出的分类器基因组成,该方法包括:(a)从来自患者的肺组织样品中分离核酸材料;(b)将该核酸材料与基本上与该分类器生物标记物的核酸分子的部分互补的寡核苷酸混合;并且(c)检测该分类器生物标记物的表达。在一些情况下,该方法还包括将检测到的表1的该至少一种分类器生物标记物的表达水平与至少一个样品训练集中的表1的该至少一种分类器生物标记物的表达进行比较,其中该至少一个样品训练集包含来自参考基底型SQ样品的表1的该至少一种分类器生物标记物的表达数据、来自参考经典型SQ样品的表1的该至少一种分类器生物标记物的表达数据、来自参考分泌型SQ样品的表1的该至少一种分类器生物标记物的表达数据、来自参考原发型SQ样品的表1的该至少一种分类器生物标记物的表达数据或其组合;并且基于比较步骤的结果将样品分类为基底、经典、分泌或原发亚型。在一些情况下,比较步骤包括应用统计算法,该统计算法包括确定从样品获得的表达数据与来自该至少一个训练集的表达数据之间的相关性;并且基于统计算法的结果将样品分类为基底、经典、分泌或原发亚型。在一些情况下,对表达水平的检测包括进行qRT-PCR或任何基于杂交的基因测定。在一些情况下,通过进行qRT-PCR检测表达水平。在一些情况下,表达水平的检测包括使用对表1的至少一种分类器生物标记物有特异性的至少一对寡核苷酸引物。在一些情况下,该方法还包括基于检测到的分类器生物标记物的表达水平预测对用于治疗肺鳞状细胞癌(SQ)亚型的疗法的反应。在一些情况下,该疗法是化学疗法、血管生成抑制剂和/或免疫疗法。在一些情况下,肺SQ的亚型是原发型,并且疗法是免疫疗法。在一些情况下,样品是从患者获得的***固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,编码分类器生物标记物的该至少一种核酸分子包含编码多种分类器生物标记物的多种核酸分子。在一些情况下,该多种分类器生物标记物包含选自表1的至少两种分类器生物标记物、至少10种分类器生物标记物、至少20种分类器生物标记物、至少30种分类器生物标记物、至少40种分类器生物标记物、至少50种分类器生物标记物、至少60种分类器生物标记物、或至少70种分类器生物标记物。在一些情况下,编码分类器生物标记物的该至少一种核酸分子包含编码表1的所有分类器生物标记物的多种核酸分子。
在又另一个方面,本文提供了检测从患者获得的肺组织样品中的生物标记物的方法,该方法包括使用扩增、杂交和/或测序测定来测量选自表1的多种生物标记物核酸的表达水平。在一些情况下,肺组织样品先前被诊断为鳞状细胞癌。在一些情况下,先前的诊断是通过组织学检查。在一些情况下,扩增、杂交和/或测序测定包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。在一些情况下,通过进行qRT-PCR检测表达水平。在一些情况下,表达水平的检测包括对于选自表1的该多种生物标记物核酸中的每一种使用至少一对寡核苷酸引物。在一些情况下,样品是从患者获得的***固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,该多种生物标记物核酸包含表1的至少两种生物标记物核酸、至少10种生物标记物核酸、至少20种生物标记物核酸、至少30种生物标记物核酸、至少40种生物标记物核酸、至少50种生物标记物核酸、至少60种生物标记物核酸、或至少70种生物标记物核酸,基本上由其组成或由其组成。在一些情况下,该多种生物标记物核酸包含表1的所有分类器生物标记物核酸,基本上由其组成或由其组成。
在另外的方面,本文提供了检测从患者获得的肺组织样品中的生物标记物的方法,该方法基本上由以下组成:使用扩增、杂交和/或测序测定来测量选自表1的多种生物标记物核酸的表达水平。在一些情况下,肺组织样品先前被诊断为鳞状细胞癌。在一些情况下,先前的诊断是通过组织学检查。在一些情况下,扩增、杂交和/或测序测定包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。在一些情况下,通过进行qRT-PCR检测表达水平。在一些情况下,表达水平的检测包括对于选自表1的该多种生物标记物核酸中的每一种使用至少一对寡核苷酸引物。在一些情况下,样品是从患者获得的***固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,该多种生物标记物核酸包含表1的至少两种生物标记物核酸、至少10种生物标记物核酸、至少20种生物标记物核酸、至少30种生物标记物核酸、至少40种生物标记物核酸、至少50种生物标记物核酸、至少60种生物标记物核酸、或至少70种生物标记物核酸,基本上由其组成或由其组成。在一些情况下,该多种生物标记物核酸包含表1的所有分类器生物标记物核酸,基本上由其组成或由其组成。
在一个方面,本文提供了检测从患者获得的肺组织样品中的生物标记物的方法,该方法由以下组成:使用扩增、杂交和/或测序测定来测量选自表1的多种生物标记物核酸的表达水平。在一些情况下,肺组织样品先前被诊断为鳞状细胞癌。在一些情况下,先前的诊断是通过组织学检查。在一些情况下,扩增、杂交和/或测序测定包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。在一些情况下,通过进行qRT-PCR检测表达水平。在一些情况下,表达水平的检测包括对于选自表1的该多种生物标记物核酸中的每一种使用至少一对寡核苷酸引物。在一些情况下,样品是从患者获得的***固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,该多种生物标记物核酸包含表1的至少两种生物标记物核酸、至少10种生物标记物核酸、至少20种生物标记物核酸、至少30种生物标记物核酸、至少40种生物标记物核酸、至少50种生物标记物核酸、至少60种生物标记物核酸、或至少70种生物标记物核酸,基本上由其组成或由其组成。在一些情况下,该多种生物标记物核酸包含表1的所有分类器生物标记物核酸,基本上由其组成或由其组成。
在另一个方面,本文提供了确定鳞状细胞癌患者是否可能对免疫疗法有反应的方法,该方法包括确定来自患者的肺组织样品的鳞状细胞癌亚型,其中该鳞状细胞癌亚型选自下组,该组由以下组成:原发型、经典型、分泌型和基底型;并且基于该亚型,评估患者是否可能对免疫疗法有反应。在一些情况下,免疫疗法包括检查点抑制剂疗法。在一些情况下,检查点抑制剂靶向PD-1或PD-L1。在一些情况下,检查点抑制剂靶向CTLA-4。在一些情况下,检查点抑制剂是派姆单抗(Pembrolizumab)、纳武单抗(Nivolumab)或其抗原片段结合片段。在一些情况下,检查点抑制剂是伊匹单抗(Ipilimumab)或其抗原结合片段。在一些情况下,最初经由样品的组织学分析确定患者患有鳞状细胞癌。在一些情况下,患者的鳞状细胞癌亚型选自原发型、经典型、分泌型或基底型,并且经由对从患者获得的样品的组织学分析来确定。在一些情况下,样品是从患者获得的***固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,确定鳞状细胞癌亚型包括确定多种分类器生物标记物的表达水平。在一些情况下,对该多种分类器生物标记物的表达水平的确定是在核酸水平上通过进行RNA测序、逆转录酶聚合酶链反应(RT-PCR)或基于杂交的分析来进行。在一些情况下,用于确定鳞状细胞癌亚型的该多种分类器生物标记物选自可公开获得的肺鳞状细胞癌数据集。在一些情况下,可公开获得的肺鳞状细胞癌数据集是TCGA肺SQ RNAseq数据集。在一些情况下,用于确定鳞状细胞癌亚型的该多种分类器生物标记物选自表1。在一些情况下,RT-PCR是定量实时逆转录酶聚合酶链反应(qRT-PCR)。在一些情况下,使用对表1的该多种分类器生物标记物特异的引物进行RT-PCR。在一些情况下,该方法还包括将检测到的表1的该多种分类器生物标记物的表达水平与至少一个样品训练集中的表1的该多种分类器生物标记物的表达进行比较,其中该至少一个样品训练集包含来自参考基底型鳞状细胞癌样品的表1的该多种分类器生物标记物的表达数据、来自参考经典型鳞状细胞癌样品的表1的该多种分类器生物标记物的表达数据、来自参考原发型鳞状细胞癌样品的表1的该多种分类器生物标记物的表达数据、来自参考分泌型鳞状细胞癌样品的表1的该多种分类器生物标记物的表达数据或其组合;并且基于比较步骤的结果将第一样品分类为基底、经典、原发或分泌亚型。在一些情况下,比较步骤包括应用统计算法,该统计算法包括确定从样品获得的表达数据与来自该至少一个训练集的表达数据之间的相关性;并且基于统计算法的结果将样品分类为基底、经典、原发或分泌亚型。在一些情况下,该多种分类器生物标记物包含表1中列出的分类器生物标记物中的每一种。
在又另一个方面,本文提供了用于选择鳞状细胞癌患者进行免疫疗法的方法,该方法包括确定来自该患者的肺组织样品的鳞状细胞癌亚型;并且基于该亚型选择该患者进行免疫疗法。在一些情况下,免疫疗法包括检查点抑制剂疗法。在一些情况下,检查点抑制剂靶向PD-1或PD-L1。在一些情况下,检查点抑制剂靶向CTLA-4。在一些情况下,检查点抑制剂是派姆单抗(Pembrolizumab)、纳武单抗(Nivolumab)或其抗原片段结合片段。在一些情况下,检查点抑制剂是伊匹单抗(Ipilimumab)或其抗原结合片段。在一些情况下,最初经由样品的组织学分析确定患者患有鳞状细胞癌。在一些情况下,患者的鳞状细胞癌亚型选自原发型、经典型、分泌型或基底型,并且经由对从患者获得的样品的组织学分析来确定。在一些情况下,样品是从患者获得的***固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,确定鳞状细胞癌亚型包括确定多种分类器生物标记物的表达水平。在一些情况下,对该多种分类器生物标记物的表达水平的确定是在核酸水平上通过进行RNA测序、逆转录酶聚合酶链反应(RT-PCR)或基于杂交的分析来进行。在一些情况下,用于确定鳞状细胞癌亚型的该多种分类器生物标记物选自可公开获得的肺鳞状细胞癌数据集。在一些情况下,可公开获得的肺鳞状细胞癌数据集是TCGA肺SQ RNAseq数据集。在一些情况下,用于确定鳞状细胞癌亚型的该多种分类器生物标记物选自表1。在一些情况下,RT-PCR是定量实时逆转录酶聚合酶链反应(qRT-PCR)。在一些情况下,使用对表1的该多种分类器生物标记物特异的引物进行RT-PCR。在一些情况下,该方法还包括将检测到的表1的该多种分类器生物标记物的表达水平与至少一个样品训练集中的表1的该多种分类器生物标记物的表达进行比较,其中该至少一个样品训练集包含来自参考基底型鳞状细胞癌样品的表1的该多种分类器生物标记物的表达数据、来自参考经典型鳞状细胞癌样品的表1的该多种分类器生物标记物的表达数据、来自参考原发型鳞状细胞癌样品的表1的该多种分类器生物标记物的表达数据、来自参考分泌型鳞状细胞癌样品的表1的该多种分类器生物标记物的表达数据或其组合;并且基于比较步骤的结果将第一样品分类为基底、经典、原发或分泌亚型。在一些情况下,比较步骤包括应用统计算法,该统计算法包括确定从样品获得的表达数据与来自该至少一个训练集的表达数据之间的相关性;并且基于统计算法的结果将样品分类为基底、经典、原发或分泌亚型。在一些情况下,该多种分类器生物标记物包含表1中列出的分类器生物标记物中的每一种。
在一个方面,本文提供了治疗受试者的肺癌的方法,该方法包括:测量从受试者获得的肺癌样品中至少一种生物标记物核酸的表达水平,其中该至少一种生物标记物核酸选自表1中列出的一组生物标记物,其中该至少一种生物标记物的存在、不存在和/或水平指示肺癌的亚型;并且基于肺癌的亚型给予免疫治疗剂。在一些情况下,肺癌样品是鳞状细胞癌样品,并且其中该组生物标记物是表1。在一些情况下,选自该组生物标记物的该至少一种生物标记物核酸包含表1的至少两种生物标记物核酸、至少10种生物标记物核酸、至少20种生物标记物核酸、至少30种生物标记物核酸、至少40种生物标记物核酸、至少50种生物标记物核酸、至少60种生物标记物核酸、至少70种生物标记物核酸或所有生物标记物核酸,基本上由其组成或由其组成。在一些情况下,肺组织样品先前被诊断为鳞状细胞癌。在一些情况下,先前的诊断是通过组织学检查。在一些情况下,该方法还包括测量来自另外一组生物标记物的至少一种生物标记物的表达。在一些情况下,该另外一组生物标记物包含先天免疫细胞(IIC)、适应性免疫细胞(AIC)的基因表达标签,一种或多种个体免疫生物标记物,一种或多种干扰素(IFN)基因,一种或多种主要组织相容性复合物II类(MHCII)基因或其组合。在一些情况下,该另外一组生物标记物包含选自表4A、表4B、表5、表6、表7或其组合的基因。在一些情况下,AIC的基因表达标签选自表4A。在一些情况下,IIC的基因表达标签选自表4B。在一些情况下,该一种或多种个体免疫生物标记物选自表5。在一些情况下,该一种或多种IFN基因选自表6。在一些情况下,该一种或多种MHCII基因选自表7。在一些情况下,测量表达水平使用扩增、杂交和/或测序测定来进行。在一些情况下,扩增、杂交和/或测序测定包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。在一些情况下,通过进行qRT-PCR检测表达水平。在一些情况下,样品是从患者获得的***固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。在一些情况下,体液是血液或其部分、尿液、唾液或痰液。在一些情况下,受试者的鳞状细胞癌亚型选自原发型、经典型、分泌型或基底型。在一些情况下,肺癌亚型是原发型,并且其中免疫治疗剂包含检查点抑制剂。在一些情况下,检查点抑制剂靶向PD-1或PD-L1。在一些情况下,检查点抑制剂靶向CTLA-4。在一些情况下,检查点抑制剂是派姆单抗(Pembrolizumab)、纳武单抗(Nivolumab)或其抗原片段结合片段。在一些情况下,检查点抑制剂是伊匹单抗(Ipilimumab)或其抗原结合片段。在一些情况下,该至少一种生物标记物核酸是多种生物标记物核酸,其中该多种生物标记物核酸包含表1中列出的至少一种生物标记物核酸与来自可公开获得的肺鳞状细胞癌数据集的一种或多种生物标记物核酸的组合,其中该多种生物标记物核酸的存在、不存在和/或水平指示肺癌的亚型。在一些情况下,该至少一种生物标记物核酸是多种生物标记物核酸,其中该多种生物标记物核酸包含表1中列出的所有生物标记物核酸与来自可公开获得的肺鳞状细胞癌数据集的一种或多种生物标记物核酸的组合,其中该多种生物标记物核酸的存在、不存在和/或水平指示肺癌的亚型。在一些情况下,可公开获得的肺鳞状细胞癌数据集是TCGA肺SQ RNAseq数据集。
附图简述
图1示出了肺癌亚型分型和鳞状细胞癌(SCC或SQ)和腺癌(AC或AD)的生物学亚型。
图2示出了在实施例1中描述的研究中使用的肺SQ数据集。
图3示出了癌症基因组图集(Cancer Genome Atlas,TCGA)肺SQ数据集中的免疫细胞标签表达(即,来自实施例1的Bindea等人的参考文献)、其他免疫标记物和个体免疫标记物的热图。
图4示出了TCGA SQ数据集中的免疫细胞标签的相关矩阵,其中通过分层聚类来排列标签。深红色表示一对基因更呈正相关。白色表示没有相关。深蓝色表示负相关。
图5示出了如实施例1中所述的跨多个SQ数据集的T细胞标签基因表达亚型模式的再现性。RNAseq(Illumina,San Diego,CA)以及来自Affymetrix(Santa Clara,CA)和Agilent(Santa Clara,CA)两者的微阵列。
图6示出了在TCGA数据集的鳞状细胞癌(SCC或SQ)评估中在CD274(PD-L1)表达与适应性免疫细胞(AIC)标签之间的关联(经调整的R平方)。亚型的关联始终大于PD-L1的关联。在SQ中,如实施例1中所述,亚型的关联始终大于PD-LI。Tcm=中枢记忆T细胞,Tem=效应记忆T细胞,Th1=1型T辅助细胞,Th2=2型T辅助细胞,TFH=T滤泡辅助细胞,Th17=T辅助17细胞,Treg=T调节细胞,Tgd=γδT细胞。
图7A-图7B示出了如实施例1中所述的整体和按照亚型的标签-存活关联。从分层的cox模型计算的风险比(HR)和置信区间对应于标准化免疫标记物的单位增加,并针对病理阶段进行调整。针对阶段调整亚型特异性HR(整体通过阶段和亚型进行调整),并且仅显示了对于至少一种亚型具有显著关联(标称p<0.05)的免疫特征。SQ=鳞状细胞癌,MHC II=主要组织相容性II类基因标签,Th1=1型T辅助细胞,Th2=2型T辅助细胞,TFH=T滤泡辅助细胞,Th17=T辅助17细胞,Treg=T调节细胞,DC=树突细胞,iDC=未成熟树突细胞。图7A-图7B显示了TCGA群组中(图7A)或者TGCA、UNC和Raponi群组中(图7B)免疫细胞标签和标记物按照SQ亚型的存活关联。对于图7A,亚型特异性免疫标记物风险比和95%置信区间是针对TCGA群组(n=501SQ)中的5年总体存活期。
图8示出了用于选择包含在如实施例2中所述用于对肺SQ亚型分型的基因集中的基因的方法(即,针对TCGA RNASeq肺SQ数据集的50-50高/低方法;普通方法;混合方法;针对转录组的50-50高/低方法(50-50高/低20K方法))的比较。在RNASeq肺鳞状细胞癌(SQ)数据集上对癌症基因组图集(TCGA)进行5折(five-fold)交叉验证研究,除了50-50高/低20K方法外。
图9示出了对癌症基因组图集(TCGA)RNASeq肺SQ数据集进行的5折交叉验证研究,以便确定包含以用于对SQ亚型分型的基因的最佳数量。
图10示出了基因-基因相关系数和鳞状细胞癌亚型。
图11示出了来自208个基因金标准SQ分类器的基因的基因等级(X轴)和t统计量(Y轴),所述分类器是通过对来自表1的SQ基因分类器组中包含的癌症基因组图集(TCGA)的肺RNASeq SQ数据集(n=506)应用进行修改的至最近质心阵列分类(Classifying arrays toNearest Centroid,CLaNC)算法来选择的。
图12示出了来自选择用于区分基底型样品的80个基因分类器的20基因子集的中值基因表达。
图13示出了来自选择用于区分经典型样品的80个基因分类器的20基因子集的中值基因表达。
图14示出了来自选择用于区分原发型样品的80个基因分类器的20基因子集的中值基因表达。
图15示出了来自选择用于区分分泌型样品的80个基因分类器的20基因子集的中值基因表达。
图16示出了通过本文提供的80个基因标签(CLANC80)与定义多个验证数据集和新收集的FFPE验证数据集的金标准亚型的208个基因分类器的SQ亚型预测的一致性。与Lee、Raponi(rap)、FFPE、TGCA和UNC的一致性分别为84%、91%、87%、88%和89%。
图17示出了癌症基因组图集(Cancer Genome Atlas,TCGA)肺SQ数据集中的免疫细胞标签(即,来自实施例3的Bindea等人的参考文献)、其他免疫标记物和个体免疫标记物的热图。
图18示出了如实施例3中所述的跨多个SQ数据集的T细胞标签基因表达亚型模式的再现性。
图19示出了如实施例3中所述的在CD274(PD-L1)表达与适应性免疫细胞(AIC)标签之间相对于在亚型与AIC标签之间的关联(经调整的R平方)。Tcm=中枢记忆T细胞,Tem=效应记忆T细胞,Th1=1型T辅助细胞,Th2=2型T辅助细胞,TFH=T滤泡辅助细胞,Th17=T辅助17细胞,Treg=T调节细胞,Tgd=γδT细胞。
图20示出了如实施例3中所述的整体和按照亚型的SQ标签-存活关联。根据分层cox模型计算风险比(HR)和置信区间。针对阶段调整亚型特异性HR(整体通过阶段和亚型进行调整),并且仅显示了具有显著关联(p<0.05)的免疫特征。
图21示出了所有免疫细胞和免疫标志物(即,IFN基因、MHCII基因和个体免疫标志物PDL1、PDL2、PDCD1和CTLA4)相对于SQ亚型的箱形图。SCC=鳞状细胞癌。
图22示出了鳞状细胞癌(SQ)亚型非沉默突变负荷、SQ中的NFE2L2表达、和MHC II类标签,连同Kruskal-Wallis关联检验p值。MHC II=主要组织相容性II类基因标签。
图23示出了在增生、非沉默突变负荷、和关键药物靶标(CD274(PD-L1)、PDCD1(PD-1)和CTLA4)方面的显著腺鳞状细胞癌(SQ)亚型差异。如实施例4中所述确定SQ亚型分型。
图24示出了针对临床实体瘤突变小组(表8中公开的322种基因)中的大多数基因,SQ亚型的显著药物靶标基因表达差异。在SQ亚型中,76%显示出差异表达(KW Bonferroni阈值p<0.000155)。如实施例4中所述确定SQ亚型分型。
图25示出了针对临床实体瘤突变小组(表8中公开的322种基因)中的大多数基因,SQ亚型的显著药物靶标基因表达差异。在SQ亚型中,70%显示出差异表达(KW Bonferroni阈值p<0.000155)。如实施例5中所述确定SQ亚型分型。
图26示出了在增生方面的显著鳞状细胞癌(SQ)亚型差异。如实施例5中所述确定SQ亚型分型。
发明详述
概述
本发明提供了用于鉴定或诊断肺癌的试剂盒、组合物和方法。也就是说,该方法可以用于肺癌(特别是肺鳞状细胞癌(SQ))的分子定义的亚组。该方法提供了肺癌的分类,其可以针对治疗反应进行预后和预测。虽然是用于流行病学目的的有用术语,但“肺癌”可能不是指特定疾病,而是可以代表肺部、支气管和胸膜的肿瘤的异质集合。出于实际目的,肺癌通常可以分为两种组织学亚型-小细胞肺癌(SCLC)和非小细胞肺癌(NSCLC)。这些主要肿瘤类型可以以不同的频率存在,可以具有不同的解剖学位置,可以具有不同的转移偏好,可以对疗法有不同的反应,并且可能源自不同的细胞祖细胞。
“确定鳞状细胞癌亚型”可以包括例如诊断或检测鳞状细胞癌的存在和类型,监测疾病的进展,以及鉴定或检测指示亚型的细胞或样品。
在一个实施方案中,通过评价一个或多个受试者样品中多种分类器基因或生物标记物的表达模式或表达谱来评估肺癌状态。出于讨论的目的,术语“受试者”或“受试者样品”是指个体而不管健康和/或疾病状态。受试者可以是受试者、研究参与者、患者、对照受试者、筛查受试者、或在本发明的上下文中从其获得和评估样品的任何其他类别的个体。因此,受试者可以被诊断患有肺鳞状细胞癌(包括亚型或其等级),可以出现肺SQ癌的一种或多种症状、或肺癌的易感因素(例如家族(遗传)或病史(医学)因子),可以正在经历肺癌治疗或疗法等。可替代地,关于任何上述因子或标准,受试者可以是健康的。应当理解,如本文所用的术语“健康的”与肺癌状态有关,因为术语“健康的”不能被定义为对应于任何绝对评价或状态。因此,参考任何特定疾病或疾病标准定义为健康的个体实际上可以被诊断患有任何其他一种或多种疾病,或者表现出任何其他一种或多种疾病标准(包括一种或多种其他癌症)。
如本文所用,“表达谱”或“生物标记物谱”或“基因标签”包含对应于鉴别性或分类器基因的表达的相对丰度、水平、存在或不存在的测量值的一个或多个值。表达谱可以来源于在肺癌诊断之前或之后的受试者,可以来源于在治疗或疗法之前或之后的一个或多个时间点从受试者收集的生物样品,可以来源于在其间没有进行治疗或疗法(例如,以监测疾病的进展或评估被诊断患有肺癌或有患肺癌风险的受试者的疾病的发展)的一个或多个时间点从受试者收集的生物样品,或者可以从健康的受试者收集。术语受试者可以与患者互换使用。患者可以是人类患者。本文提供的生物标记物谱的该一种或多种生物标记物选自表1的一种或多种生物标记物。
如本文所用,术语“确定表达水平”或“确定表达谱”或“检测表达水平”或“检测表达谱”如关于生物标记物或分类器所用,意指向样品(例如受试者或患者的样品和/或对照样品)应用生物标记物特异性试剂(例如探针、引物或抗体)和/或方法,用于定量、半定量或定性地确定或测量一种或多种生物标记物的量(例如生物标记物多肽或mRNA(或由其衍生的cDNA)的量)。例如,生物标记物的水平可以通过许多方法确定,包括例如免疫测定,包括例如免疫组织化学、ELISA、Western印迹、免疫沉淀等,其中生物标记物检测试剂例如抗体(例如标记的抗体)特异性结合生物标记物并允许例如相对或绝对确定多肽生物标记物的量;杂交和PCR方案,其中使用探针或引物或引物组来确定核酸生物标记物的量,包括例如基于探针和基于扩增的方法,包括例如微阵列分析、RT-PCR(如定量RT-PCR(qRT-PCR))、基因表达系列分析(SAGE)、Northern印迹、数字分子条形码技术(例如纳米串(Nanostring)计数器分析)和TaqMan定量PCR试验。可以应用其他mRNA检测和定量方法,例如在***固定的石蜡包埋(FFPE)组织样品或细胞中的mRNA原位杂交。该技术目前由QuantiGeneViewRNA(Affymetrix)提供,其使用每个mRNA的探针组,该探针组特异性结合扩增***以扩增杂交信号;可以使用标准荧光显微镜或成像***使这些放大的信号可视化。例如,该***可以检测和测量异质样品中的转录物水平;例如,如果样品具有存在于相同的组织切片中的正常和肿瘤细胞。如上所述,基于TaqMan探针的基因表达分析(基于PCR)也可以用于测量组织样品中的基因表达水平,并且该技术已显示可用于测量FFPE样品中的mRNA水平。简言之,基于TaqMan探针的测定利用与mRNA靶标特异性杂交的探针。该探针含有附着于各末端的淬灭剂染料和报告染料(荧光分子),并且仅在与mRNA靶标特异性杂交时才发出荧光。在扩增步骤期间,聚合酶的核酸外切酶活性导致淬灭剂和报告染料从探针上分离,并且可以发生荧光发射。记录该荧光发射并通过检测***测量信号;将这些信号强度用于计算样品中给定转录物(基因表达)的丰度。
在一个实施方案中,与本文(例如,表1和表2)所述的基因盒或分类器基因相关的“表达谱”或“生物标记物谱”或“基因标签”可以用于在正常样品与肿瘤样品之间作出区分。在另一个实施方案中,肿瘤样品是肺SQ样品。在另一个实施方案中,基于使用本文提供的方法确定的表达谱,SQ可以进一步被分类为基底型、经典型、原发型或分泌型。使用基因表达表征基底型、经典型、原发型或分泌型鳞状细胞癌已经在Wilkerson MD等人Clin CancerRes 2010;16(19):4864-75中描述。
使用本文(例如,表1)公开的分类器或生物标记基因的表达谱可以为特异性鉴定肺鳞状细胞癌亚型以及为评估治疗肺鳞状细胞癌的治疗功效提供有价值的分子工具。因此,本发明提供了用于筛查和分类受试者的分子SQ亚型的方法和用于监测肺SQ的某些治疗性治疗的功效的方法。
在一些情况下,本文提供的单一分类器基因能够鉴定肺鳞状细胞癌的亚型,其预测成功率为至少约70%、至少约71%、至少约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、高达100%。
在一些情况下,如本文提供的单一分类器基因能够确定肺鳞状细胞癌亚型,其灵敏度或特异性为至少约70%、至少约71%、至少约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、高达100%。
本发明还涵盖能够区分使用现有方法无法检测的各种肺鳞状细胞癌亚型的***。该***能够处理大量受试者和受试者变量例如表达谱和其他诊断标准。本文所述的方法也可以用于类似于药物基因组学(pharmacogenomics)的“药物代谢组学”(pharmacometabonomics),例如,预测对疗法的反应。在该实施方案中,可以使用表达谱作为“反应”的证据将受试者分成“反应者”和“非反应者”,然后可以使用表达谱的特征来靶向将可能对特定治疗过程有反应的未来受试者。
表达谱可以与其他诊断方法组合使用,包括组织化学、免疫组织化学、细胞学、免疫细胞学、和视觉诊断方法,包括肺组织的组织学或形态学评价。
在本发明的各种实施方案中,将来源于受试者的表达谱与参考表达谱进行比较。“参考表达谱”可以是从在治疗或疗法之前的受试者来源的谱;可以是在特定时间点(通常在治疗或疗法之前或之后,但也可以包括在诊断肺癌之前或之后的特定时间点)从受试者样品产生的谱;或者可以来源于健康个体或来自健康个体的合并参考。参考表达谱可以是肺癌通用的,或者可以特异于肺鳞状细胞癌的不同亚型。
可以将参考表达谱与测试表达谱进行比较。“测试表达谱”可以源自于与参考表达谱相同的受试者(除了在随后的时间点(例如,在收集参考表达谱之后的一天或多天、一周或几周、或者一个月或几个月)之外),或者可以源自于不同的受试者。总之,可以将受试者的任何测试表达谱与来自具有基底、经典、原发或分泌亚型的受试者的先前收集的谱进行比较。
本发明的分类器生物标记物可以包括核酸(RNA、cDNA和DNA)和蛋白质、及其变体和片段。此类生物标记物可以包括含有编码生物标记物的核酸序列的全部或部分序列的DNA,或这样的序列的互补序列。本文所述的生物标记物可以包括含有任何感兴趣核酸序列的全部或部分序列的RNA、或其在逆转录反应中体外合成获得的非天然cDNA产物。生物标记物核酸还可以包括感兴趣核酸序列的任何表达产物或其部分。生物标记物蛋白质可以是由本发明的DNA生物标记物编码或与其对应的蛋白质。生物标记物蛋白质可以包含任何生物标记物蛋白质或多肽的全部或部分氨基酸序列。生物标记物核酸可以从细胞中提取,或者可以是无细胞的或从细胞外囊泡实体(如外泌体)中提取。
“分类器生物标记物”或“生物标记物”或“分类器基因”可以是与正常或健康细胞或组织相比其在组织或细胞中表达的水平改变的任何基因或蛋白质。例如,“分类器生物标记物”或“生物标记物”或“分类器基因”可以是在特定肺鳞状细胞癌亚型中其在组织或细胞中表达的水平改变的任何基因或蛋白质。检测本发明的生物标记物可以允许对特定亚型的确定。“分类器生物标记物”或“生物标记物”或“分类器基因”可以是相对于如本文提供的参考或对照被上调(例如表达增加)或被下调(例如表达降低)的那种基因或蛋白质。参考或对照可以是如本文提供的任何参考或对照。在一些实施方案中,可以将在肺鳞状细胞癌的特定亚型中上调或下调的基因的表达值合并到一个基因盒中。在每个基因盒中的总体表达水平在本文中被称为“表达谱”,并且用于根据肺鳞状细胞癌的亚型对测试样品进行分类。然而,应理解,对本文公开的每种基因的表达的独立评价可以用于对肿瘤亚型进行分类,而无需将被上调和下调的基因分组成一个或多个基因盒。在一些情况下,如表2中所示,可以将总共80种生物标记物用于SQ亚型确定。对于每种SQ亚型,20种生物标记物中的10种可以是负相关基因,而10种可以是可以被选择作为特定SQ亚型的基因标签的正相关基因。
本发明的分类器生物标记物可以包括在肺SQ中选择性表达的任何基因或蛋白质,如本文上面所定义。样品生物标记物基因列于下表1或表2中。在表2中,该表的第一列表示选择用于区分基底型SQ的生物标记物列表。该表的第二列表示选择用于经典型SQ的生物标记物列表。该表的第三列表示选择用于区分原发型SQ的生物标记物列表。该表的第四列表示选择用于区分分泌型SQ的生物标记物列表。
表1中显示了用于肺SQ亚型分型的分类器生物标记物的如本文所述的由tsat表示的相对基因表达水平。在一个实施方案中,表1中显示了用于肺SQ亚型分型的分类器生物标记物的基因表达水平。在一个实施方案中,所有80种基因都可以用于分类SQ的亚型。在一个实施方案中,前20种基因是基底型样品的选定基因标签生物标记物,其中与非基底型样品相比,基因编号1-10被上调且基因编号11-20被下调。在另一个实施方案中,基因编号21-40是对经典型样品有特异性的选定基因标签生物标记物,其中与非经典型样品相比,基因编号21-30被上调且基因编号31-40被下调。在又另一个实施方案中,基因编号41-60是对原发型样品有特异性的选定基因标签生物标记物,其中与非原发型样品相比,基因编号41-50被上调且基因编号51-60被下调。在又另一个实施方案中,基因编号61-80是对分泌型样品有特异性的选定基因标签生物标记物,其中与非原发型样品相比,基因编号61-70被上调且基因编号71-80被下调。
表1.肺鳞状细胞癌(SQ)亚型的80种分类器生物标记物的基因质心
Figure GDA0002040024300000191
Figure GDA0002040024300000201
Figure GDA0002040024300000211
Figure GDA0002040024300000221
Figure GDA0002040024300000231
Figure GDA0002040024300000241
Figure GDA0002040024300000251
Figure GDA0002040024300000261
Figure GDA0002040024300000271
*每个GenBank登录号是所列基因的代表性或示例性GenBank登录号,并且出于所有目的将其通过引用以其整体并入本文。此外,每个列出的代表性或示例性登录号不应解释为将权利要求限制为特定登录号。
表2.为基底、经典、原发和分泌SQ亚型选择的分类器生物标记物
Figure GDA0002040024300000272
Figure GDA0002040024300000281
诊断用途
在一个实施方案中,本文提供的方法和组合物允许用比本领域已知的分子SQ亚型分型方法需要的更少的基因来区分鳞状细胞癌的四种亚型:(1)基底型;(2)经典型;(3)原发型;和(4)分泌型。
通常,将本文提供的方法用于将肺癌样品分类为特定的肺癌亚型(例如鳞状细胞癌的亚型)。在一个实施方案中,该方法包括检测或确定任何可公开获得的肺AD表达数据集的至少一种分类器生物标记物的表达水平。在一个实施方案中,该方法包括测量、检测或确定从患者或受试者获得的肺癌样品中表1的至少一种分类器生物标记物的表达水平。
用于本文所述的检测或区分方法的肺癌样品可以是先前确定或诊断为鳞状细胞癌样品的样品。先前的诊断可以是基于组织学分析。组织学分析可以由一名或多名病理学家进行。
在一个实施方案中,在本文提供的方法中采用的测量或检测步骤是在核酸水平上,其通过在适合于RNA-seq、RT-PCR或杂交的条件下,用与该至少一种分类器生物标记物(例如表1的分类器生物标记物)的cDNA分子的部分基本上互补的寡核苷酸进行RNA-seq、逆转录酶聚合酶链反应(RT-PCR)或杂交测定,并且基于检测步骤获得该至少一种分类器生物标记物的表达水平。然后将该至少一种分类器生物标记物的表达水平与来自至少一个样品训练集的该至少一种分类器生物标记物(例如表1的分类器生物标记物)的参考表达水平进行比较。该至少一个样品训练集可以包含(i)来自过表达该至少一种生物标记物的样品的该至少一种生物标记物的表达水平、(ii)来自参考基底、经典、原发或分泌SQ亚型的表达水平、或(iii)来自无鳞状细胞癌肺部样品的表达水平,并且将肺组织样品分类为基底、经典、原发或分泌亚型。然后可以基于比较步骤的结果将肺癌样品分类为基底、经典、原发或分泌亚型的鳞状细胞癌。在一个实施方案中,比较步骤可以包括应用统计算法,该统计算法包括确定从肺部组织或癌症样品获得的表达数据与来自该至少一个训练集的表达数据之间的相关性;并且基于统计算法的结果将肺部组织或癌症样品分类为基底、经典、原发或分泌亚型。
在一个实施方案中,本文提供的方法包括在从患者获得的肺癌样品中在核酸水平上探测本文提供的至少一种分类器生物标记物(例如表1的分类器生物标记物)的水平。肺癌样品可以是先前确定或诊断为鳞状细胞癌样品的样品。先前的诊断可以是基于组织学分析。组织学分析可以由一名或多名病理学家进行。在一个实施方案中,探测步骤包括在适合于一种或多种寡核苷酸与其互补序列或基本互补序列杂交的条件下将样品与该一种或多种寡核苷酸混合,该寡核苷酸与本文提供的该至少一种分类器生物标记物(例如表1的分类器生物标记物)的cDNA分子的部分基本上互补;检测该一种或多种寡核苷酸与其互补序列或基本互补序列之间是否发生杂交;并且基于检测步骤获得该至少一种分类器生物标记物的杂交值。然后将该至少一种分类器生物标记物的杂交值与来自至少一个样品训练集的一个或多个参考杂交值进行比较。例如,该至少一个样品训练集包含来自参考基底型、经典型、原发型或分泌型样品的杂交值。基于比较步骤的结果,将肺癌样品分类为例如基底型、经典型、原发型或分泌型。
肺组织样品可以是从人受试者或患者分离的任何样品。例如,在一个实施方案中,对包埋在石蜡中的肺活组织检查上进行分析。在一个实施方案中,样品可以是新鲜冷冻的肺组织样品。在另一个实施方案中,样品可以是从患者获得的体液。体液可以是血液或其部分(即,血清、血浆)、尿液、唾液、痰液或脑脊髓液(CSF)。样品可以含有用于在本文提供的方法中使用的核酸的细胞来源以及细胞外来源。细胞外来源可以是无细胞的DNA和/或外泌体。在一个实施方案中,样品可以是细胞沉淀物或洗涤液。本发明的这个方面提供了一种通过精确鉴定主要组织学类型(甚至从小的活组织检查中)来改善当前诊断的手段。本发明的方法(包括RT-PCR方法)是灵敏的、精确的并且具有多分析物能力以便用于石蜡包埋的样品。参见例如,Cronin等人(2004)Am.J Pathol.164(1):35-42,通过引用并入本文。
在光学显微镜评价之前,***固定和石蜡中的组织包埋是组织处理的通用方法。***固定的石蜡包埋的(FFPE)样本提供的主要优点是保留组织切片中的细胞和结构学形态细节。(Fox等人(1985)J Histochem Cytochem 33:845-853)。在其中处理活组织检查样本的标准缓冲***固定剂典型地是含有37%甲醛和10%-15%甲醇的水性溶液。甲醛是一种高反应性偶极化合物,其导致在体外形成蛋白质-核酸和蛋白质-蛋白质交联(Clark等人(1986)J Histochem Cytochem 34:1509-1512;McGhee和von Hippel(1975)Biochemistry 14:1281-1296,各自通过引用并入本文)。
在一个实施方案中,本文使用的样品获自个体,并且包含***固定的石蜡包埋的(FFPE)组织。然而,其他组织和样品类型适合于在本文中使用。在一个实施方案中,其他组织和样品类型可以是新鲜冷冻的组织、洗涤液体或细胞沉淀物等。在一个实施方案中,样品可以是从个体获得的体液。体液可以是血液或其部分(例如,血清、血浆)、尿液、痰液、唾液或脑脊髓液(CSF)。如本文提供的生物标记物核酸可以从细胞中提取,或者可以是无细胞的或从细胞外囊泡实体(如外泌体)中提取。
用于从FFPE组织中分离RNA的方法在本领域中是已知的。在一个实施方案中,可以从FFPE组织中分离总RNA,如由Bibikova等人(2004)American Journal of Pathology165:1799-1807所述,通过引用并入本文。同样,可以使用高纯的RNA石蜡试剂盒(High PureRNA Paraffin Kit)(罗氏公司(Roche))。通过二甲苯萃取去除石蜡,随后用乙醇洗涤。可以使用MasterPure纯化试剂盒(Epicenter,Madison,Wis.)从切片组织块中分离RNA;包括DNA酶I处理步骤。可以根据供应商的说明书(Invitrogen Life Technologies,Carlsbad,Calif.)使用Trizol试剂从冷冻样品中提取RNA。可以将具有可测量的残留基因组DNA的样品重新进行DNaseI处理并测定DNA污染。可以根据制造商的方案进行所有纯化、DNA酶处理和其他步骤。在总RNA分离之后,可以将样品储存在-80℃下直至使用。
用于mRNA提取的一般方法是本领域熟知的,并且公开于分子生物学的标准教科书中,包括Ausubel等人,编辑,Current Protocols in Molecular Biology,John Wiley&Sons,New York 1987-1999。从石蜡包埋的组织中提取RNA的方法公开在例如Rupp和Locker(Lab Invest.56:A67,1987)以及De Andres等人(Biotechniques 18:42-44,1995)。具体地,可以使用来自商业制造商例如Qiagen(Valencia,Calif.)的纯化试剂盒、缓冲液组和蛋白酶根据制造商的说明书进行RNA分离。例如,可以使用Qiagen RNeasy微型柱分离来自培养物中的细胞的总RNA。其他可商购的RNA分离试剂盒包括MasterPureTM。完整的DNA和RNA纯化试剂盒(Complete DNA and RNA Purification Kit)(Epicentre,Madison,Wis.)以及石蜡块RNA分离试剂盒(Paraffin Block RNA Isolation Kit)(Ambion,Austin,Tex.)。可以例如使用RNA Stat-60(Tel-Test,Friendswood,Tex.)分离来自组织样品的总RNA。可以例如通过氯化铯密度梯度离心分离从肿瘤制备的RNA。另外,可以使用本领域技术人员熟知的技术(例如Chomczynski的单步RNA分离方法(美国专利号4,843,155,出于所有目的通过引用以其整体并入))容易地处理大量的组织样品。
在一个实施方案中,样品包含从肺组织样品(例如鳞状细胞癌样品)收获的细胞。可以使用本领域已知的标准技术从生物样品中收获细胞。例如,在一个实施方案中,通过离心细胞样品并重悬浮沉淀的细胞来收获细胞。可以将细胞重悬浮于缓冲溶液如磷酸盐缓冲盐水(PBS)中。在将细胞悬浮液离心获得细胞沉淀之后,可以将细胞裂解以提取核酸,例如信使RNA。所有获得自受试者的样品,包括经受任何种类的进一步处理的那些,均应认为是获得自该受试者。
在一个实施方案中,在检测本文所列出的生物标记物组合的生物标记物水平之前,将样品进一步处理。例如,在细胞或组织样品中的mRNA可以与该样品的其他组分分开。可以将样品浓缩和/或纯化以分离处于其非天然状态的mRNA,因为mRNA不是处于其天然环境中。例如,研究已经表明体内mRNA的较高级结构不同于相同序列的体外结构(参见例如,Rouskin等人(2014).Nature 505,第701-705页,出于所有目的以其整体并入本文)。
在一个实施方案中,来自样品的mRNA与合成DNA探针杂交,该探针在一些实施方案中包括检测部分(例如,可检测标记、捕获序列、条形码报告序列)。因此,在这些实施方案中,最终制得非天然mRNA-cDNA复合物并将其用于检测生物标记物。在另一个实施方案中,将来自样品的mRNA直接用可检测标记(例如荧光团)进行标记。在另外的实施方案中,非天然标记的mRNA分子杂交至cDNA探针,并且检测复合物。
在一个实施方案中,一旦从样品获得mRNA,则将其在杂交反应中转化为互补DNA(cDNA),或者与一种或多种cDNA探针一起用于杂交反应中。cDNA在体内不存在,并因此是非天然分子。另外,cDNA-mRNA杂交体是合成的并且在体内不存在。除了cDNA在体内不存在之外,cDNA必然不同于mRNA,因为它包括脱氧核糖核酸而非核糖核酸。然后例如通过聚合酶链反应(PCR)或本领域普通技术人员已知的其他扩增方法将cDNA扩增。例如,可以采用的其他扩增方法包括连接酶链反应(LCR)(Wu和Wallace,Genomics,4:560(1989),Landegren等人,Science,241:1077(1988),出于所有目的通过引用以其整体并入);转录扩增(Kwoh等人,Proc.Natl.Acad.Sci.USA,86:1173(1989),出于所有目的通过引用以其整体并入);自持序列复制(self-sustained sequence replication)(Guatelli等人,Proc.Nat.Acad.Sci.USA,87:1874(1990),出于所有目的通过引用以其整体并入),出于所有目的通过引用以其整体并入;以及基于核酸的序列扩增(NASBA)。用于选择PCR扩增引物的指南对于本领域普通技术人员而言是已知的。参见例如,McPherson等人,PCR Basics:From Background to Bench,Springer-Verlag,2000,出于所有目的通过引用以其整体并入。这种扩增反应的产物(即扩增的cDNA)必然也是非天然产物。首先,如上所述,cDNA是非天然分子。其次,在PCR的情况下,扩增过程用于针对起始材料的每个单独cDNA分子产生数以亿计的cDNA拷贝。生成的拷贝数目与体内存在的mRNA的拷贝数目相差甚远。
在一个实施方案中,将cDNA用将另外的DNA序列(例如,衔接子、报告子、捕获序列或部分、条形码)引入片段上的引物(例如,使用衔接子特异性引物)扩增,或者将mRNA或cDNA生物标记物序列直接与包含该另外的序列(例如,衔接子、报告子、捕获序列或部分、条形码)的cDNA探针杂交。因此扩增和/或mRNA与cDNA探针的杂交用于通过引入另外的序列并形成非天然杂交体而从非天然单链cDNA或mRNA产生非天然双链分子。另外,如本领域普通技术人员已知的,扩增程序具有与其相关的错误率。因此,扩增将另外的修饰引入cDNA分子中。在一个实施方案中,在用衔接子特异性引物扩增期间,可检测标记(例如荧光团)被添加到单链cDNA分子上。因此,扩增还用于产生天然不存在的DNA复合物,至少因为(i)cDNA在体内不存在,(i)衔接子序列被添加到cDNA分子的末端以得到体内不存在的DNA序列,(ii)与扩增相关的错误率进一步产生体内不存在的DNA序列,(iii)与天然存在的那些相比cDNA分子的结构不同,以及(iv)将可检测标记化学添加到cDNA分子上。
在一些实施方案中,感兴趣的生物标记物的表达是经由检测非天然cDNA分子在核酸水平上检测的。
在一些实施方案中,本文提供的用于肺癌SQ亚型分型的方法包括检测分类器生物标记物组的表达水平。在一些实施方案中,检测包括在核酸水平或蛋白质水平上的表1的所有分类器生物标记物。在另一个实施方案中,检测表1的分类器生物标记物的单个或子集或多种(例如,从约10种至约20种)。例如,在一个实施方案中,在确定肺癌SQ亚型的方法中检测表1中的从约5种至约10种、从约10种至约20种、从约20种至约40种、从约40种至约60种、从约60种至约80生物标记物。在另一个实施方案中,在确定肺癌亚型的方法中检测来自表1的每种生物标记物。在另一个实施方案中,选择来自表1的20种生物标记物作为特定肺癌SQ亚型的基因标签。
例如使用对分类器生物标记物有特异性的引物和/或探针、和/或类似物,可以通过任何合适的技术(包括但不限于RNA-seq、逆转录酶聚合酶链反应(RT-PCR)、微阵列杂交测定、或另一种杂交测定(例如纳米串测定))来进行检测。在一些情况下,用于扩增方法(例如,RT-PCR或qRT-PCR)的引物是适用于结合本文提供的分类器基因(例如表1中列出的分类器生物标记物)的任何正向和反向引物。
本文所述的生物标记物包括含有任何感兴趣核酸序列的全部或部分序列的RNA,或其在逆转录反应中体外合成获得的非天然cDNA产物。术语“片段”旨在指代通常包含至少10个、15个、20个、50个、75个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、800个、900个、1,000个、1,200个、或1,500个连续核苷酸或高达存在于本文公开的全长生物标记物多核苷酸中的核苷酸数目的多核苷酸的一部分。生物标记物多核苷酸的片段将通常编码至少15个、25个、30个、50个、100个、150个、200个、或250个连续氨基酸,或高达存在于本发明的全长生物标记物蛋白中的氨基酸总数。
在一些实施方案中,过表达(例如RNA转录物或其表达产物的过表达)通过归一化至参考RNA转录物或其表达产物的水平来确定,该参考RNA转录物或其表达产物可以是样品中的所有测量的转录物(或其产物)或特定的RNA转录物(或其非天然cDNA产物)的参考集。进行归一化以校正所测定的RNA或cDNA的量的差异以及所使用的RNA或cDNA的质量的变化两者,或使这两者归一化。因此,测定典型地测量并结合某些归一化基因(包括众所周知的管家基因,如例如GAPDH和/或β-肌动蛋白)的表达。可替代地,归一化可以是基于所有所测定的生物标记物或其大的子集的平均或中值信号(全局归一化方法)。
可以将分离的mRNA用于杂交或扩增测定,其包括但不限于Southern或Northern分析、PCR分析和探针阵列、纳米串测定。检测mRNA水平的一种方法涉及使分离的mRNA或合成的cDNA与核酸分子(探针)接触,该核酸分子可以与被检测基因编码的mRNA杂交。核酸探针可以是例如cDNA或其部分,例如长度为至少7个、15个、30个、50个、100个、250个、或500个核苷酸的寡核苷酸并且足以在严格条件下与本发明的非天然cDNA或mRNA生物标记物特异性地杂交。
如上所解释,在一个实施方案中,一旦从样品中获得mRNA,就在杂交反应中将其转化为互补DNA(cDNA)。可以用包含与特定mRNA的一部分互补的序列的寡核苷酸或引物进行mRNA向cDNA的转化。可以用包含随机序列的寡核苷酸或引物进行mRNA向cDNA的转化。可以用包含与mRNA的poly(A)尾互补的序列的寡核苷酸或引物进行mRNA向cDNA的转化。cDNA在体内不存在,并因此是非天然分子。在另外的实施方案中,然后例如通过聚合酶链反应(PCR)或本领域普通技术人员已知的其他扩增方法将cDNA扩增。可以用包含与本文提供的分类器基因(例如表1中的分类器生物标记物)的至少一部分互补的序列的正向和/或反向引物进行PCR。这种扩增反应的产物(即扩增的cDNA)必然是非天然产物。如上所述,cDNA是非天然分子。其次,在PCR的情况下,扩增过程用于针对起始材料的每个单独cDNA分子产生数以亿计的cDNA拷贝。生成的拷贝数目与体内存在的mRNA的拷贝数目相差甚远。
在一个实施方案中,用将另外的DNA序列(衔接子序列)引入片段上的引物(使用衔接子特异性引物)扩增cDNA。衔接子序列可以是尾部,其中该尾部序列不与cDNA互补。例如,包含与本文提供的分类器基因(例如来自表1的分类器生物标记物)的至少一部分互补的序列的正向和/或反向引物可以包含尾部序列。因此,通过将条形码、衔接子和/或报告序列引入已经非天然的cDNA上,扩增用于从非天然单链cDNA产生非天然双链分子。在一个实施方案中,在用衔接子特异性引物扩增期间,可检测标记(例如荧光团)被添加到单链cDNA分子上。因此,扩增还用于产生天然不存在的DNA复合物,至少因为(i)cDNA在体内不存在,(ii)衔接子序列被添加到cDNA分子的末端以得到体内不存在的DNA序列,(iii)与扩增相关的错误率进一步产生体内不存在的DNA序列,(iv)与天然存在的那些相比cDNA分子的结构不同,以及(v)将可检测标记化学添加到cDNA分子上。
在一个实施方案中,经由与探针杂交,例如经由微阵列,将合成的cDNA(例如,扩增的cDNA)固定在固体表面上。在另一个实施方案中,经由引入与cDNA产物杂交的荧光探针,经由实时聚合酶链反应(PCR)检测cDNA产物。例如,在一个实施方案中,通过定量荧光RT-PCR(例如,使用
Figure GDA0002040024300000351
探针)评估生物标记物检测。对于PCR分析,本领域中可获得用于确定用于在分析中使用的引物序列的众所周知的方法。
在一个实施方案中,本文提供的生物标记物通过使用捕获探针和/或报告探针的杂交反应来检测。例如,杂交探针是衍生到固体表面(例如珠粒、玻璃或硅基底)上的探针。在另一个实施方案中,捕获探针存在于溶液中并与患者样品混合,随后例如通过生物素-亲和素相互作用将杂交产物附着于表面(例如,其中生物素是捕获探针的一部分,并且亲和素在表面上)。在一个实施方案中,杂交测定使用捕获探针和报告探针两者。报告探针可以与捕获探针或生物标记物核酸中的任一者杂交。然后对报告探针进行计数和检测,以确定样品中一种或多种生物标记物的水平。在一个实施方案中,捕获探针和/或报告探针含有可检测标记,和/或允许官能化到表面上的基团。
例如,nCounter基因分析***(参见例如,Geiss等人(2008)Nat.Biotechnol.26,第317-325页,出于所有目的通过引用以其整体并入)适用于与本文提供的方法一起使用。
在美国专利号7,473,767和8,492,094(出于所有目的将其公开内容通过引用以其整体并入)中描述的杂交测定适用于与本文提供的方法一起使用,即,适用于检测本文所述的生物标记物和生物标记物组合。
可以使用膜印迹(例如用于杂交分析,如Northern印迹、Southern印迹、斑点印迹等)、或微孔、样品管、凝胶、珠粒或纤维(或包含结合核酸的任何固体支持物)来监测生物标记物水平。参见例如,美国专利号5,770,722、5,874,219、5,744,305、5,677,195和5,445,934,各自通过引用以其整体并入。
在一个实施方案中,将微阵列用于检测生物标记物水平。由于不同实验之间的再现性,微阵列特别适合于此目的。DNA微阵列提供了一种同时测量大量基因的表达水平的方法。每个阵列由附着于固体支持物上的可再现模式的捕获探针组成。标记的RNA或DNA与阵列上的互补探针杂交,并然后通过激光扫描阵列上每个探针的杂交强度来检测,并将其转化为代表相对基因表达水平的定量值。参见例如,美国专利号6,040,138、5,800,992和6,020,135、6,033,860和6,344,316,各自通过引用以其整体并入。高密度寡核苷酸阵列特别适用于确定样品中大量RNA的基因表达谱。
使用机械合成方法合成这些阵列的技术描述于例如美国专利号5,384,261中。尽管通常使用平面阵列表面,但是阵列可以制造在几乎任何形状的表面或甚至多个表面上。阵列可以是在珠粒、凝胶、聚合物表面、纤维(例如光纤)、玻璃或任何其他适当的基底上的核酸(或肽)。参见例如,美国专利号5,770,358、5,789,162、5,708,153、6,040,193和5,800,992,各自通过引用以其整体并入。阵列可以以这样一种方式包装,以致于允许全包式设备的诊断或其他操作。参见例如,美国专利号5,856,174和5,922,591,各自通过引用以其整体并入。
在一个实施方案中,将基因表达系列分析(SAGE)用于本文所述的方法中。SAGE是允许同时和定量分析大量基因转录物的方法,无需为每种转录物提供单独的杂交探针。首先,生成短序列标签(约10-14bp),其中含有足够的信息来独特地鉴定转录物,条件是该标签是从每个转录物内的独特位置获得的。然后,许多转录物连接在一起形成长系列分子,可以对其进行测序,同时揭示多个标签的身份。通过确定单个标签的丰度并鉴定与每个标签对应的基因,可以定量评价任何转录物群体的表达模式。参见,Velculescu等人Science270:484-87,1995;Cell 88:243-51,1997,通过引用以其整体并入。
在核酸水平上的另外的生物标记物水平分析方法是使用测序方法,例如RNAseq、下一代测序和大规模平行标签测序(MPSS),如Brenner等人(Nat.Biotech.18:630-34,2000,通过引用以其整体并入)所描述的。这是在单独的5μm直径微珠上将基于非凝胶的标签测序与数百万个模板的体外克隆组合的一种测序方法。首先,通过体外克隆构建DNA模板的微珠文库。随后是在流动池中以高密度(典型地大于3.0X 106个微珠/cm2)组装含有模板的微珠的平面阵列。使用不需要DNA片段分离的基于荧光的标签测序方法,同时分析每个微珠上的所克隆模板的自由端。已经显示该方法在一次操作中同时且准确地提供来自酵母cDNA文库的数十万个基因标签序列。
在核酸水平上的另一种生物标记物水平表达分析方法是使用扩增方法,如例如RT-PCR或定量RT-PCR(qRT-PCR)。用于确定样品中生物标记物mRNA水平的方法可以包括核酸扩增的过程,例如通过RT-PCR(Mullis,1987,美国专利号4,683,202中所述的实验性实施方案)、连接酶链反应(Barany(1991)Proc.Natl.Acad.Sci.USA 88:189-193)、自持序列复制(Guatelli等人(1990)Proc.Natl.Acad.Sci.USA 87:1874-1878)、转录扩增***(Kwoh等人(1989)Proc.Natl.Acad.Sci.USA 86:1173-1177)、Qβ复制酶(Lizardi等人(1988)Bio/Technology 6:1197)、滚环复制(Lizardi等人,美国专利号5,854,033)或任何其他核酸扩增方法,随后使用本领域技术人员熟知的技术检测所扩增的分子。许多不同的PCR或qRT-PCR方案是本领域已知的,并且可以使用目前描述的组合物直接应用于或适用于检测和/或定量样品中区别基因的表达。参见例如,Fan等人(2004)Genome Res.14:878-885,通过引用并入本文。通常,在PCR中,通过与至少一种寡核苷酸引物或一对寡核苷酸引物反应来扩增靶多核苷酸序列。一种或多种引物与靶核酸的互补区杂交,并且DNA聚合酶延伸该一种或多种引物以扩增靶序列。在足以提供基于聚合酶的核酸扩增产物的条件下,一种大小的核酸片段为主反应产物(作为扩增产物的靶多核苷酸序列)。重复扩增循环以增加单个靶多核苷酸序列的浓度。反应可以在通常用于PCR的任何热循环仪中进行。
在一些情况下定量RT-PCR(qRT-PCR)(也称为实时RT-PCR)是优选的,因为它不仅提供定量测量,还提供减少的时间和污染。如本文所用,“定量PCR”(或“实时qRT-PCR”)是指当PCR扩增发生时在不需要对反应产物重复取样的情况下直接监测PCR扩增的进程。在定量PCR中,可以在产生反应产物时通过信号传导机制(例如荧光)监测反应产物,并在信号上升到背景水平之后但在反应达到平稳之前跟踪反应产物。达到可检测或“阈值”荧光水平所需的循环次数直接随着PCR过程开始时可扩增靶标的浓度而变化,从而能够测量信号强度以实时提供样品中靶核酸的量的量度。可以将DNA结合染料(例如,SYBR green)或标记探针用于检测通过PCR扩增产生的延伸产物。可以使用利用包含本发明序列的标记探针的任何探针形式。
免疫组织化学方法也适用于检测本发明的生物标记物的水平。可以将样品冷冻用于后续制备或立即置于固定剂溶液中。可以组织样品通过用试剂如***、戊二醛、甲醇等处理来固定,并包埋在石蜡中。从***固定的、石蜡包埋的组织样品制备用于免疫组织化学分析的切片的方法是本领域熟知的。
在一个实施方案中,本文提供的生物标记物(例如表1的分类器生物标记物(或其子集,例如10种至20种、20种至30种、30种至40种、40种至50种、50种至60种、60种至70种、或70种至80种生物标记物))的水平,针对所有RNA转录物或其非天然cDNA表达产物、或样品中蛋白质产物的表达水平、或者RNA转录物的参考集或其非天然cDNA表达产物的参考集、或其样品中蛋白质产物的参考集的表达水平进行归一化。
在一个实施方案中,可以使用本文提供的分类器基因(例如表1中列出的分类器生物标记物)中的一种或多种的蛋白质表达水平来评价肺鳞状细胞癌亚型。可以使用免疫学检测方法来测量蛋白质表达水平。可以用于本文中的免疫学检测方法包括但不限于使用如下技术的竞争性和非竞争性测定***,例如Western印迹、放射免疫测定、ELISA(酶联免疫吸附测定)、“三明治”免疫测定、免疫沉淀测定、沉淀素反应、凝胶扩散沉淀素反应、免疫扩散测定、凝集测定、补体固定测定、免疫放射测定、荧光免疫测定、蛋白A免疫测定等。此类测定是常规的并且是本领域熟知的(参见例如,Ausubel等人,编辑,1994,Current Protocolsin Molecular Biology,第I卷,John Wiley&Sons,Inc.,New York,将其通过引用以其整体并入)。
在一个实施方案中,利用对生物标记物蛋白有特异性的抗体来检测身体样品中生物标记物蛋白的表达。该方法包括从患者或受试者获得身体样品,使身体样品与针对在肺癌细胞中选择性表达的生物标记物的至少一种抗体接触,并且检测抗体结合以确定生物标记物是否在患者样品中表达。本发明的优选方面提供了用于诊断肺癌亚型的免疫细胞化学技术。本领域技术人员将认识到,本文下面描述的免疫细胞化学方法可以手动进行或以自动方式进行。
如贯穿全文所提供的,本文所述的方法提供了用于确定患者的肺癌SQ亚型的方法。一旦例如通过测量非天然cDNA生物标记物水平或非天然mRNA-cDNA生物标记物复合物确定了生物标记物水平,就例如通过使用统计学方法或直接比较检测水平将生物标记物水平与参考值或参考样品进行比较,以确定肺癌分子SQ亚型。基于该比较,将患者的肺癌样品进行SQ分类,例如分类为基底型、经典型、原发型或分泌型。
在一个实施方案中,将本文提供的该至少一种分类器生物标记物(例如表1的分类器生物标记物)的表达水平值与来自至少一个样品训练集的一个或多个参考表达水平值进行比较,其中该至少一个样品训练集包含来自一个或多个参考样品的表达水平值。在另外的实施方案中,该至少一个样品训练集包含来自基底型、经典型、原发型、分泌型样品或其组合的本文提供的该至少一种分类器生物标记物(例如表1的分类器生物标记物)的表达水平值。
在单独的实施方案中,将本文提供的该至少一种分类器生物标记物(例如表1的分类器生物标记物)的杂交值与来自至少一个样品训练集的一个或多个参考杂交值进行比较,其中该至少一个样品训练集包含来自一个或多个参考样品的杂交值。在另外的实施方案中,该至少一个样品训练集包含来自近端基底型、经典型、原发型、分泌型样品或其组合的本文提供的该至少一种分类器生物标记物(例如表1的分类器生物标记物)的杂交值。本文提供了用于将检测到的生物标记物水平与参考值和/或参考样品进行比较的方法。基于该比较,在一个实施方案中,获得从受试者样品获得的生物标记物水平与参考值之间的相关性。然后进行肺癌SQ亚型的评估。
可以使用各种统计方法来辅助从患者获得的生物标记物水平与例如来自至少一个样品训练集的参考生物标记物水平的比较。
在一个实施方案中,采用监督模式识别方法。监督模式识别方法的例子可以包括但不限于最近质心方法(Dabney(2005)Bioinformatics 21(22):4148-4154以及Tibshirani等人(2002)Proc.Natl.Acad.Sci.USA 99(10):6576-6572);类别分析的软独立建模(SIMCA)(参见例如,Wold,1976);偏最小二乘分析(PLS)(参见例如,Wold,1966;Joreskog,1982;Frank,1984;Bro,R.,1997);线性判别分析(LDA)(参见例如,Nillson,1965);K-最近邻分析(KNN)(参见例如,Brown等人,1996);人工神经网络(ANN)(参见例如,Wasserman,1989;Anker等人,1992;Hare,1994);概率神经网络(PNN)(参见例如,Parzen,1962;Bishop,1995;Speckt,1990;Broomhead等人,1988;Patterson,1996);规则归纳法(RI)(参见例如,Quinlan,1986);以及贝叶斯方法(参见例如,Bretthorst,1990a,1990b,1988)。在一个实施方案中,基于基因表达数据用于鉴定肿瘤亚型的分类器是基于质心的方法,其描述于Mullins等人(2007)Clin Chem.53(7):1273-9(将其各自通过引用以其整体并入本文)中。
在其他实施方案中,采用无监督训练方法,并因此,不使用训练集。
再次参考用于监督学习方法的样品训练集,在一些实施方案中,一个或多个样品训练集可以包括来自鳞状细胞癌样品的多种或所有分类器生物标记物(例如,表1的所有分类器生物标记物)的表达数据。该多种分类器生物标记物可以包含表1的至少两种分类器生物标记物、至少10种分类器生物标记物、至少20种分类器生物标记物、至少30种分类器生物标记物、至少40种分类器生物标记物、至少50种分类器生物标记物、至少60种分类器生物标记物、或至少70种分类器生物标记物。在一些实施方案中,对一个或多个样品训练集进行归一化以去除样品与样品之间的变化。
在一些实施方案中,比较可以包括应用统计算法(如例如,任何合适的多变量统计分析模型),该统计算法可以是参数的或非参数的。在一些实施方案中,应用统计算法可以包括确定从人肺组织样品获得的表达数据与来自该一个或多个鳞状细胞癌训练集的表达数据之间的相关性。在一些实施方案中,进行交叉验证,如(例如)留一交叉验证(leave-one-out cross-validation,LOOCV)。在一些实施方案中,进行整合关联(integrativecorrelation)。在一些实施方案中,进行斯皮尔曼关联(Spearman correlation)。在一些实施方案中,基于基因表达数据,将基于质心的方法用于统计算法中,如Mullins等人(2007)Clin Chem.53(7):1273-9(将其通过引用以其整体并入本文)所描述的。
对来自受试者的样品(测试样品)进行的基因表达的结果可以与一个或多个已知或怀疑是正常的生物样品(“参考样品”或“正常样品”,例如非鳞状细胞癌样品)或来自其的数据进行比较。在一些实施方案中,参考样品或参考基因表达数据获自或源自于已知具有鳞状细胞癌的特定分子亚型(即基底型、经典型、分泌型或原发型)的个体。
可以同时或在与测试样品不同的时间对参考样品进行测定。可替代地,来自参考样品的生物标记物水平信息可以存储在数据库或其他装置中以供在以后的日期访问。
可以将对测试样品的测定的生物标记物水平结果与对参考样品的相同测定的结果进行比较。在一些情况下,对参考样品的测定的结果来自数据库或是一个或多个参考值。在一些情况下,对参考样品的测定的结果是本领域技术人员已知的或通常接受的值或值的范围。在一些情况下,比较是定性的。在其他情况下,比较是定量的。在一些情况下,定性比较或定量比较可能涉及但不限于以下项中的一项或多项:比较荧光值、光斑强度、吸光度值、化学发光信号、直方图、临界阈值、统计显著性值、本文所述基因的表达水平、mRNA拷贝数目。
在一个实施方案中,针对每个生物标记物水平小组测量计算优势比(OR)。这里,OR是患者的测量生物标记物值与结果(例如,肺鳞状细胞癌亚型)之间的关联的量度。例如参见,J.Can.Acad.Child Adolesc.Psychiatry 2010;19(3):227-229,出于所有目的将其通过引用以其整体并入。
在一个实施方案中,可以确定指定的统计置信水平,以便提供关于肺癌亚型的置信水平。例如,可以确定大于90%的置信水平可以是肺癌亚型的有用预测因子。在其他实施方案中,可以选择更严格或不太严格的置信水平。例如,可以选择约或至少约50%、60%、70%、75%、80%、85%、90%、95%、97.5%、99%、99.5%、或99.9%的置信水平。在一些情况下,所提供的置信水平可以与样品的质量、数据的质量、分析的质量、所使用的具体方法、和/或所分析基因表达值的数目(即,基因的数目)相关。可以基于预期的假阳性或假阴性数目来选择用于提供反应的可能性的指定置信水平。选择参数以便达到指定置信水平或以便鉴定具有诊断能力的标记物的方法包括但不限于受试者工作特征(ROC)曲线分析、副法线ROC、主成分分析、优势比分析、偏最小二乘分析、奇异值分解、最小绝对收缩与选择算子分析、最小角回归、以及阈值梯度定向正则化方法。
在一些情况下,确定肺鳞状细胞癌亚型可以通过应用设计来使基因表达数据可靠性归一化和/或改进的算法加以改进。在本发明的一些实施方案中,由于大量的待处理的单独数据点,数据分析利用了计算机或其他设备、机器或装置来应用本文所述的各种算法。“机器学***经过算法以便对谱进行分类。监督学习通常涉及“训练”分类器以识别亚型(例如基底型阳性、经典型阳性、分泌型阳性或原发型阳性)之间的区别,并然后在独立的测试集上“测试”分类器的准确性。因此,对于新的未知样品,分类器可以用于预测例如样品所属的类别(例如,基底型与经典型与分泌型与巨型(magnoid))。
在一些情况下,稳健多阵列平均(RMA)方法可以用于使原始数据归一化。RMA方法通过计算许多微阵列上各匹配细胞的背景校正强度开始。在一个实施方案中,背景校正值被限制为正值,如Irizarry等人(2003).Biostatistics April 4(2):249-64(出于所有目的通过引用以其整体并入)所述。在背景校正之后,然后获得各背景校正的匹配细胞强度的以2为底的对数。然后使用分位数归一化方法(其中对于各输入阵列和各探针值,阵列百分位探针值被所有阵列百分位点的平均值替换,该方法在Bolstad等人Bioinformatics 2003(通过引用以其整体并入)中有更完整的描述)使各微阵列上背景校正的对数转化的匹配强度归一化。在分位数归一化之后,然后可以将归一化的数据拟合到线性模型中,以获得各微阵列上各探针的强度测量值。然后可以使用Tukey中值平滑算法(Tukey,J.W.,ExploratoryData Analysis.1977,出于所有目的通过引用以其整体并入)来确定归一化探针集数据的对数尺度强度水平。
可以执行各种其他软件程序。在某些方法中,可以使用glmnet通过lasso惩罚的逻辑回归来进行特征选择和模型估计(Friedman等人(2010).Journal of statisticalsoftware 33(1):1-22,通过引用以其整体并入)。可以使用TopHat来比对原始读数(Trapnell等人(2009).Bioinformatics 25(9):1105-11,通过引用以其整体并入)。在方法中,使用e1071库(Meyer D.Support vector machines:the interface to libsvm inpackage e1071.2014,通过引用以其整体并入),将高维特征(top feature)(N的范围为从10至200)用于训练线性支持向量机(SVM)(Suykens JAK,Vandewalle J.Least SquaresSupport Vector Machine Classifiers.Neural Processing Letters 1999;9(3):293-300,通过引用以其整体并入)。在一个实施方案中,使用pROC包(Robin X,Turck N,HainardA等人pROC:an open-source package for R and S+to analyze and compare ROCcurves.BMC bioinformatics 2011;12:77,通过引用以其整体并入)来计算置信区间。
此外,可以过滤数据以除去可能被认为可疑的数据。在一个实施方案中,从具有少于约4个、5个、6个、7个或8个鸟苷+胞嘧啶核苷酸的微阵列探针衍生出的数据可以被认为是不可靠的,因为它们有异常杂交倾向或二级结构问题。类似地,从具有多于约12个、13个、14个、15个、16个、17个、18个、19个、20个、21个或22个鸟苷+胞嘧啶核苷酸的微阵列探针衍生出的数据可以被认为是不可靠的,因为它们有异常杂交倾向或二级结构问题。
在本发明的一些实施方案中,如果不以可检测的水平(高于背景)鉴定出来自探针集的数据,则它们可以从分析中排除。
在本公开文本的一些实施方案中,没有表现出变异或表现出低变异的探针集可以从进一步分析中排除。通过卡方检验从分析中排除低变异的探针集。在一个实施方案中,如果转化的变异在具有(N-1)自由度的卡方分布的99%置信区间的左侧,则探针集被认为是低变异的。(N-1)*探针集变异/(基因探针集变异)。Chi-Sq(N-1),其中N是输入CEL文件的数目,(N-1)是卡方分布的自由度,且“基因的探针集变异”是整个基因的探针集变异的平均值。在本发明的一些实施方案中,如果给定mRNA或mRNA集的探针集包含少于通过前述用于GC含量、可靠性、变异等的过滤器步骤的最低数目的探针,则可以从进一步分析中排除它们。例如,在一些实施方案中,如果给定基因或转录物簇的探针集包含少于约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或少于约20个探针,则从进一步分析中排除它们。
在一个实施方案中,生物标记物水平数据分析的方法还包括使用如本文提供的特征选择算法。在本发明的一些实施方案中,特征选择通过使用LIMMA软件包(Smyth,G.K.(2005).Limma:linear models for microarray data.In:Bioinformatics andComputational Biology Solutions using R and Bioconductor,R.Gentleman,V.Carey,S.Dudoit,R.Irizarry,W.Huber(编辑),Springer,New York,第397-420页,出于所有目的通过引用以其全文并入)提供。
在一个实施方案中,生物标记物水平数据分析的方法包括使用预分类器算法。例如,算法可以使用特异性分子指纹来根据它们的组成对样品进行预分类,然后再应用校正/归一化因子。然后可以将该数据/信息输入到最终分类算法中,其将整合该信息来辅助最终的诊断。
在一个实施方案中,生物标记物水平数据分析的方法还包括使用如本文提供的分类器算法。在本发明的一个实施方案中,提供了对角线线性判别分析、k-近邻算法、支持向量机(SVM)算法、线性支持向量机、随机森林算法、或基于概率模型的方法、或它们的组合用于微阵列数据的分类。在一些实施方案中,基于在感兴趣的类别之间生物标记物水平的差异的统计学显著性,选择区分样品的鉴定标记物(例如,不同生物标记物水平谱、和/或鳞状细胞癌的不同分子亚型(例如,基底型、经典型、分泌型、原发型)的鉴定标记物)。在一些情况下,通过针对错误发现率(FDR)应用Benjamin Hochberg校正或另一种校正来调节统计学显著性。
在一些情况下,分类器算法可以用荟萃分析方法补充,如Fishel和Kaufman等人2007Bioinformatics 23(13):1599-606(出于所有目的通过引用以其整体并入)描述的方法。在一些情况下,分类器算法可以用荟萃分析方法补充,如可重复性分析。
用于导出后验概率并将后验概率应用于生物标记物水平数据分析的方法在本领域中是已知的,并且已经描述于例如Smyth,G.K.2004Stat.Appi.Genet.Mol.Biol.3:Article 3(出于所有目的通过引用以其整体并入)中。在一些情况下,可以将后验概率用于本发明的方法中,以对由分类器算法提供的标记物进行分级。
生物标记物水平谱分析结果的统计学评价可以提供指示以下中的一种或多种的一个或多个定量值:鳞状细胞癌的分子亚型(基底型、经典型、分泌型、原发型);特定治疗干预(例如,血管生成抑制剂治疗、化学疗法或免疫疗法)成功的可能性。在一个实施方案中,数据以其最有用的形式直接呈现给医师以指导患者护理,或者用于在临床试验中定义患者群体或针对给定药物定义患者群体。分子谱分析的结果可使用本领域已知的多种方法进行统计学评估,该方法包括但不限于:学生T检验、双侧T检验、皮尔逊秩和分析、隐马尔可夫模型分析、q-q作图分析、主成分分析、单因素ANOVA、双因素ANOVA、LIMMA等。
在一些情况下,可通过随时间追踪受试者以确定原始诊断的准确性而确定准确性。在其他情况下,准确性可以按确定性的方式或使用统计学方法确立。例如,受试者工作特征(ROC)分析可用于确定最佳测定参数,以实现特定水平的准确性、特异性、阳性预测值、阴性预测值和/或错误发现率。
在一些情况下,将生物标记物水平谱分析测定的结果输入数据库中以供分子谱分析企业、个人、医疗供应商、或保险供应商的代表或代理访问。在一些情况下,测定结果包括企业的代表、代理或咨询人员(如医疗专业人员)进行的样品分类、鉴定、或诊断。在其他情况下,自动提供数据的计算机或算法分析。在一些情况下,分子谱分析企业可以向个人、保险供应商、医疗供应商、研究人员或政府实体针对以下项中的一种或多种收费:进行的分子谱分析测定、咨询服务、数据分析、报告结果或数据库访问。
在本发明的一些实施方案中,生物标记物水平谱分析测定的结果作为计算机屏幕上的报告或纸件记录呈现。在一些实施方案中,报告可以包括但不限于如以下中的一种或多种信息:与参考样品或一个或多个参考值相比生物标记物的水平(例如,如通过拷贝数目或荧光强度等报告的);基于生物标记物水平值和肺鳞状细胞亚型和建议疗法,受试者将对特定疗法有反应的可能性。
在一个实施方案中,基因表达谱分析的结果可以分为以下中的一种或多种:基底型阳性、经典型阳性、分泌型阳性、原发型阳性、基底型阴性、经典型阴性、分泌型阴性、原发型阴性;可能对血管生成抑制剂、免疫疗法或化学疗法有反应;不太可能对血管生成抑制剂、免疫疗法或化学疗法有反应;或其组合。
在本发明的一些实施方案中,使用经训练的算法对结果进行分类。本发明的经训练的算法包括已使用已知基因表达值和/或正常样品(例如,来自诊断患有特定分子亚型的鳞状细胞癌的个体的样品)的参考集开发的算法。在一些情况下,已知基因表达值的参考集从已被诊断患有特定分子亚型的鳞状细胞癌并且还已知对血管生成抑制剂疗法有反应(或不反应)的个体获得。在一些情况下,已知基因表达值的参考集从已被诊断患有特定分子亚型的鳞状细胞癌并且还已知对免疫疗法有反应(或不反应)的个体获得。在一些情况下,已知基因表达值的参考集从已被诊断患有特定分子亚型的鳞状细胞癌并且还已知对化学疗法有反应(或不反应)的个体获得。
适用于对样品分类的算法包括但不限于k-近邻算法、支持向量机、线性判别分析、对角线线性判别分析、updown、朴素贝叶斯算法、神经网络算法、隐马尔可夫模型算法、基因算法、或其任何组合。
当将二元分类器与实际真值(例如,来自生物样品的值)进行比较时,通常存在四种可能的结果。如果预测的结果是p(其中“p”是正分类器输出,例如存在删除或重复综合症)并且实际值也是p,则将其称作真阳性(TP);但是,如果实际值是n,则将其称为是假阳性(FP)。相反,当预测结果和实际值两者均为n(其中“n”是负分类器输出,例如没有删除或重复综合症)时,出现真阴性,而当预测结果为n同时实际值为p时,出现假阴性。在一个实施方案中,考虑进行试图确定人是否可能或不太可能对血管生成抑制剂疗法有反应的测试。当这个人测试为阳性但实际上确实有反应时,在这种情况下出现假阳性。另一方面,当这个人测试为阴性时(表明他们不太可能有反应),当他们实际上可能有反应时,出现假阴性。对于对肺癌亚型的分类而言也是如此。
疾病的阳性预测值(PPV)或精确率或后验概率是具有阳性测试结果的被正确诊断为可能反应或不太可能反应的、或者被诊断为具有正确的肺癌亚型、或者它们的组合的受试者的比例。它反映了阳性测试反映出测试的基础病状的概率。但是,它的值确实依赖于疾病的流行度,其可发生变化。在一个实施例中,提供以下特征:FP(假阳性);TN(真阴性);TP(真阳性);FN(假阴性)。假阳性率(α)=FP/(FP+TN)-特异性;假阴性率(β)=FN/(TP+FN)-灵敏度;能力=灵敏度=1-β;阳性似然比=灵敏度/(1-特异性);阴性似然比=(1-灵敏度)/特异性。阴性预测值(NPV)是被正确诊断的具有阴性测试结果的受试者的比例。
在一些实施方案中,主题方法的生物标记物水平分析的结果提供了给出的诊断正确的统计学置信水平。在一些实施方案中,这种统计学置信水平是至少约或多于约85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、或更多。
在一些实施方案中,该方法还包括基于样品中的生物标记物水平与(例如存在于至少一个训练集中的)参考生物标记物水平的比较将肺组织样品分类为特定肺癌亚型。在一些实施方案中,如果比较的结果满足一个或多个标准,如例如,最小百分比一致性,基于百分比一致性计算的统计量的值,例如(例如,卡帕(kappa)统计量,最小相关性(例如,皮尔逊相关性)和/或类似物,则肺组织样品被分类为特定亚型。
据预期,本文描述的方法可以通过软件(存储在存储器中和/或在硬件上执行)、硬件或其组合来进行。硬件模块可以包括通用处理器、现场可编程门阵列(FPGA)、和/或专用集成电路(ASIC)。软件模块(在硬件上执行)可以用各种软件语言(例如,计算机代码)表达,包括Unix实用工具、C、C++、JavaTM、Ruby、SQL、
Figure GDA0002040024300000461
R编程语言/软件环境、VisualBasicTM、以及其他面向对象的程序性或其他编程语言和开发工具。计算机代码的例子包括但不限于微代码或微指令、机器指令(如由编译器产生的)、用于产生网络服务的代码、以及包含使用解释器由计算机执行的高水平指令的文件。计算机代码的另外的例子包括但不限于控制信号、加密代码、和压缩代码。
本文描述的一些实施方案涉及具有非暂时性计算机可读介质(还可以称作非暂时性处理器可读介质或存储器)的设备,该介质上具有用于执行各种计算机实施的操作的指令或计算机代码和/或本文公开的方法。计算机可读介质(或处理器可读介质)在它本身不包括暂时性传播信号(例如,在传输介质如空间或缆线上传播携带信息的电磁波)的意义上是非暂时性的。该介质和计算机代码(还可以称作代码)可以是被设计并构建为用于特定目的或多个目的的那些。非暂时性计算机可读介质的例子包括但不限于:磁存储介质,如硬盘、软盘和磁带;光存储介质,如光碟/数字视频光盘(CD/DVD)、光碟只读存储器(CD-ROM)和全息设备;磁光存储介质,如光碟;载波信号处理模块;以及专门配置成存储和执行程序代码的硬件设备,例如专用集成电路(ASIC)、可编程逻辑设备(PLD)、只读存储器(ROM)和随机存取存储器(RAM)设备。在此描述的其他实施方案涉及计算机程序产品,其可以包括例如在此讨论的指令和/或计算机代码。
在一些实施方案中,单一生物标记物、或从约10种至约20种、从约20种至约30种、从约20种至约40种、从约40种至约50种、从约40种至约60种、从约60种至约70种、从约60种至约80种、从约20种至约60种、从约20种至约80种、从约40种至约80种生物标记物(例如,如表1中公开的)能够对肺鳞状细胞癌的亚型进行分类,其中预测成功率为至少约70%、至少约71%、至少约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、高达100%、以及介于两者之间的所有值。在一些实施方案中,本文(例如,在表1中)公开的生物标记物的任何组合可以用于获得至少约70%、至少约71%、至少约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、高达100%、以及介于两者之间的所有值的预测成功率。
在一些实施方案中,单一生物标记物、或从约10种至约20种、从约20种至约30种、从约20种至约40种、从约40种至约50种、从约40种至约60种、从约60种至约70种、从约60种至约80种、从约20种至约60种、从约20种至约80种、从约40种至约80种生物标记物(例如,如表1中所公开的)能够对肺鳞状细胞癌亚型进行分类,其中灵敏度或特异性为至少约70%、至少约71%、至少约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、高达100%、以及介于两者之间的所有值。在一些实施方案中,本文公开的生物标记物的任何组合可以用于获得至少约70%、至少约71%、至少约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、高达100%、以及介于两者之间的所有值的灵敏度或特异性。
分类器基因选择
在一个实施方案中,本文提供的方法和组合物可用于分析一组生物标记物在来自患者的样品(例如,肺组织样品或肺SQ样品)中的表达,其中该组生物标记物包含比本领域已知的用于对肺SQ亚型进行分子分类的方法更少数量的生物标记物。在一些情况下,该组生物标记物是少于250种、240种、230种、220种、210种、200种、150种、100种、95种或90种生物标记物。在一些情况下,该组生物标记物是表1中列出的80种生物标记物的组。在一些情况下,该组生物标记物是表1中列出的生物标记物的子集。可用于本文提供的方法和组合物中的生物标记物或分类器基因可以选自来自一个或多个数据库的一个或多个肺鳞状细胞癌数据集。该数据库可以是公共数据库。在一个实施方案中,可用于本文提供的用于检测或诊断肺鳞状细胞癌亚型的方法和组合物中的分类器基因(例如,表1和表2中列出的一种或多种基因)选自来自癌症基因组图集(TCGA)的肺鳞状细胞癌RNAseq数据集。在一个实施方案中,通过对分类器基因的大集合进行基于计算机模拟的过程以便确定其表达谱可以用于确定从受试者获得的样品的SQ亚型的最小基因数目来选择可用于本文提供的方法和组合物的分类器基因,例如表1中的那些。在一些情况下,分类器基因的大集合可以是肺SQRNAseq数据集,如例如来自TCGA。在一些情况下,分类器基因的大集合可以是Wilkerson等人(Clin Cancer Res 2010;16(19):4864-4875)中披露的208种基因分类器,其中该208种基因分类器可以用于定义金标准亚型。用于选择如本文提供的用于确定来自患者的样品的肺SQ亚型的基因盒的计算机模拟过程可以包括对标准208种分类器基因应用或使用进行修改的至最近质心阵列分类(CLaNC)算法,以针对每种亚型选择相同数量的负相关基因和正相关基因。为了确定包括在标签中的基因的最佳数目(例如,如表1中所示的每种亚型20个),该过程可以还包括使用如本文提供的TCGA肺鳞状细胞癌数据集进行5折交叉验证以产生交叉-验证曲线,如图9所示。为了获得基因分类器的最终列表,该方法可以还包括以将最近质心阵列分类(CLaNC)应用于整个TCGA数据集减去20%的具有最低金标准亚型预测强度的样品,并从每种亚型中去除相同数量。
在一个实施方案中,该方法还包括验证基因分类器。验证可以包括在几个新鲜冷冻的可公开获得的阵列和RNAseq数据集中测试分类器的表达,并基于所述表达水平称呼亚型,并随后将该表达与由如在Wilkerson等人(Clin Cancer Res 2010;16(19):4864-4875)中披露的先前公布的208种基因标签定义的金标准亚型称谓进行比较。然后可以在归档的***固定的石蜡包埋(FFPE)鳞状细胞癌样品的新收集的RNAseq数据集中进行基因标签(例如,表1)的最终验证,以确保FFPE样品中的可比性能。在一个实施方案中,基于本文所述的计算机模拟CLaNC过程选择表1的分类器生物标记物。将基因符号和官方基因名称分别列于第2列和第3列。
在一个实施方案中,本发明的方法需要在从患者获得的肺癌细胞样品(例如,肺SQ癌症样品)中检测出至少1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种、24种、25种、26种、27种、28种、29种、30种、31种、32种、33种、34种、35种、36种、37种、38种、39种、40种、41种、42种、43种、44种、45种、46种、47种、48种、49种、50种、51种、52种、53种、54种、55种、56种、57种、58种、59种、60种、61种、62种、63种、64种、65种、66种、67种、68种、69种、70种、71种、72种、73种、74种、75种、76种、77种、78种、79种或80种分类器生物标记物,以便鉴定基底、经典、分泌或原发肺鳞状细胞癌亚型。这同样适用于如本文提供的其他分类器基因表达数据集。
在另一个实施方案中,本发明的方法需要在从患者获得的肺癌细胞样品(例如,肺SQ癌症样品)中检测出表1的80种基因生物标记物中的总共至少1种、至少2种、至少5种、至少10种、至少20种、至少40种、至少60、或多达80种分类器生物标记物,以便鉴定基底、经典、分泌或原发肺鳞状细胞癌亚型。这同样适用于如本文提供的其他分类器基因表达数据集。
在一个实施方案中,表1的至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种或多达10种生物标记物在肺鳞状细胞癌的特定亚型中被“上调”。在另一个实施方案中,表1的至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种或多达10种生物标记物在肺鳞状细胞癌的特定亚型中被“下调”。这同样适用于如本文提供的其他分类器基因表达数据集。
在一个实施方案中,如本文提供的“上调的”生物标记物的表达水平增加了约0.5倍、约1倍、约1.5倍、约2倍、约2.5倍、约3倍、约3.5倍、约4倍、约4.5倍、约5倍、以及介于两者之间的任何值。在另一个实施方案中,如本文提供的“下调的”生物标记物的表达水平降低了约0.8倍、约1.4倍、约2倍、约2.6倍、约3.2倍、约3.6倍、约4倍、以及介于两者之间的任何值。
认识到在本发明的实践中可以使用另外的基因或蛋白质。通常,可用于对肺鳞状细胞癌亚型进行分类的基因包括能够独立地在正常与肿瘤之间、或肺癌的不同类别或等级之间作出区分的那些基因。如果受试者工作特征(receiver operator characteristic,ROC)曲线下面积约为1,则认为基因能够可靠地区分亚型。
临床/治疗用途
在一个实施方案中,本文提供了一种用于确定患有癌症的患者的疾病结果或预后的方法。在一些情况下,该癌症是肺癌。可以通过检查一段时间或间隔(例如,0至36个月或者0至60个月)的总体存活期来测量疾病结果或预后。在一个实施方案中,根据亚型(例如,对于肺癌,SQ(基底型、经典型、分泌型或原发型))对存活期进行分析。可以使用标准卡普兰-迈耶(Kaplan-Meier)图以及Cox比例风险模型来评估无复发和总体存活期。
在一个实施方案中,在确定患者的肺癌亚型后,选择患者以接受合适的疗法,例如化学疗法或用血管生成抑制剂的药物疗法或免疫疗法。在一个实施方案中,在确定患者的肺癌亚型后,向患者给予合适的治疗剂,例如一种或多种化学治疗剂、或血管生成抑制剂、或一种或多种免疫治疗剂。在一个实施方案中,该疗法是免疫疗法,并且该免疫治疗剂是检查点抑制剂、单克隆抗体、生物反应调节剂、治疗性疫苗或细胞免疫疗法。
本发明的方法还可用于评价对疗法的临床反应,以及对于临床试验的终点用于评价新疗法的功效。可以将顺序诊断表达谱向正常移动的程度用作候选疗法的功效的一种量度。
在一个实施方案中,本发明的方法还可用于基于肺鳞状细胞癌(SQ)的亚型预测对不同线的疗法的反应。例如,可以通过更准确地分配肿瘤亚型来改进化学治疗反应。同样,可以基于肿瘤亚型来配制治疗方案。例如,临床试验已显示令人信服的证据证明VEGF抑制剂(贝伐单抗)可以有效治疗NSCLC。在一个实施方案中,原发SQ亚型对免疫疗法可以具有增强的反应。在另一个实施方案中,所有亚型对化学疗法、血管生成抑制剂治疗和免疫疗法可以具有增强的反应。
在一个实施方案中,在确定患者的肺鳞状细胞癌亚型后,选择患者以接受合适的疗法,例如化学疗法、免疫疗法或用血管生成抑制剂的药物疗法。在一个实施方案中,在使用本文提供的方法确定患者的肺鳞状细胞癌亚型后,向患者给予合适的治疗剂,例如一种或多种化学治疗剂、免疫治疗剂或血管生成抑制剂。
血管生成抑制剂
在一个实施方案中,在确定患者的肺SQ亚型后,选择患者以接受用血管生成抑制剂的药物疗法。在确定患者是否可能对血管生成抑制剂疗法有反应、或选择患者以接受血管生成抑制剂疗法时,在一个实施方案中,向患者给予血管生成抑制剂。血管生成抑制剂可以是本文所述的任何血管生成抑制剂。
在一个实施方案中,疗法是血管生成抑制剂疗法,并且血管生成抑制剂是血管内皮生长因子(VEGF)抑制剂、VEGF受体抑制剂、血小板衍生生长因子(PDGF)抑制剂或PDGF受体抑制剂。
每个生物标记物小组可以包括分类器可用的一种、两种、三种、四种、五种、六种、七种、八种、九种、十种、20种、40种、60种、80种或更多种生物标记物(也称为“分类器生物标记物”),以评估鳞状细胞癌患者是否可能对血管生成抑制剂疗法有反应;选择鳞状细胞癌患者以接受血管生成抑制剂疗法;确定“缺氧得分”和/或将鳞状细胞癌样品亚型分型为基底、经典、分泌或原发分子亚型。如本文所用,术语“分类器”可以指用于统计分类的任何算法,并且可以在硬件、软件或其组合中实施。分类器可以具有2级、3级、4级或更高级的分类,并且可以依赖于被分类的实体的性质。可以采用一种或多种分类器来实现本文公开的方面。
通常,本文提供了确定鳞状细胞癌患者是否可能对血管生成抑制剂疗法有反应的方法、或选择鳞状细胞癌患者以接受血管生成抑制剂疗法的方法。在一个实施方案中,该方法包括使用本文所述的方法评估患者的鳞状细胞癌亚型是基底型、经典型、分泌型还是原发型(例如,评估表1的一种或多种分类器生物标记物的表达),并且在核酸水平上探测来自患者的鳞状细胞癌样品中选自下组的至少五种生物标记物的水平,该组由以下组成:RRAGD、FABP5、UCHL1、GAL、PLOD、DDIT4、VEGF、ADM、ANGPTL4、NDRG1、NP、SLC16A3、和C14ORF58(参见表3)。在另外的实施方案中,探测步骤包括将样品与五种或更多种寡核苷酸混合,该五种或更多种寡核苷酸在适合于该五种或更多种寡核苷酸与其互补序列或基本互补序列杂交的条件下与该至少五种生物标记物的核酸分子的部分基本上互补,检测在该五种或更多种寡核苷酸与其互补序列或基本互补序列之间是否发生杂交;并且基于该检测步骤获得样品的杂交值。然后将样品的杂交值与来自至少一个样品训练集的一个或多个参考杂交值进行比较,其中该至少一个样品训练集包含(i)来自过表达该至少五种生物标记物或过表达该至少五种生物标记物的子集的样品的该至少五种生物标记物的一个或多个杂交值,(ii)来自参考基底型、经典型、分泌型或原发型样品的该至少五种生物标记物的杂交值,或(iii)来自无鳞状细胞癌样品的该至少五种生物标记物的杂交值。然后基于(i)患者的鳞状细胞癌亚型和(ii)比较的结果来确定患者是否可能对血管生成抑制剂疗法有反应、或选择患者以接受血管生成抑制剂。
Figure GDA0002040024300000521
Figure GDA0002040024300000531
*每个GenBank登录号是所列基因的代表性或示例性GenBank登录号,并且出于所有目的将其通过引用以其整体并入本文。此外,每个列出的代表性或示例性登录号不应解释为将权利要求限制为特定登录号。
上述一组十三种生物标记物或其子集在本文中也称为“缺氧谱”。
在一个实施方案中,本文提供的方法包括在从受试者获得的鳞状细胞癌样品中确定选自RRAGD、FABP5、UCHL1、GAL、PLOD、DDIT4、VEGF、ADM、ANGPTL4、NDRG1、NP、SLC16A3、和C14ORF58的至少五种生物标记物、至少六种生物标记物、至少七种生物标记物、至少八种生物标记物、至少九种生物标记物、或至少十种生物标记物、或者五种至十三种、六种至十三种、七种至十三种、八种至十三种、九种至十三种或十种至十三种生物标记物的水平。在一些情况下,生物标记物表达可以针对样品中所有RNA转录物或其表达产物的表达水平或针对RNA转录物或其表达产物的参考集进行归一化。如贯穿全文所解释的参考集可以是与鳞状细胞癌样品平行测试的实际样品,或者可以是来自数据库或存储的数据集的值的参考集。在一个实施方案中,以拷贝数目、相对荧光值或检测的荧光值报告表达水平。如使用本文提供的方法确定的缺氧谱连同鳞状细胞癌亚型的生物标记物的表达水平可以用于本文所述的方法中,以确定患者是否可能对血管生成抑制剂疗法有反应。
在一个实施方案中,针对样品中的所有RNA转录物或其非天然cDNA表达产物、或蛋白质产物的表达水平,或者样品中的RNA转录物的参考集或其非天然cDNA表达产物的参考集、或其蛋白质产物的参考集的表达水平,对十三种生物标记物(或其子集,如上所述,例如五种或更多种、从约五种至约13种)的表达水平进行归一化。
在一个实施方案中,血管生成抑制剂治疗包括但不限于整合素拮抗剂;选择素拮抗剂;粘附分子拮抗剂(细胞间粘附分子(ICAM)-1、ICAM-2、ICAM-3、血小板内皮粘附分子(PCAM)、血管细胞粘附分子(VCAM)的拮抗剂);淋巴细胞功能相关抗原1(LFA-1);碱性成纤维细胞生长因子拮抗剂;血管内皮生长因子(VEGF)调节剂;血小板衍生生长因子(PDGF)调节剂(例如,PDGF拮抗剂)。
在确定受试者是否可能对整合素拮抗剂有反应的一个实施方案中,该整合素拮抗剂是小分子整合素拮抗剂,例如,由Paolillo等人(Mini Rev Med Chem,2009,第12卷,第1439-1446页,通过引用以其整体并入)描述的拮抗剂、或白细胞粘附诱导细胞因子或生长因子拮抗剂(例如,肿瘤坏死因子-α(TNF-α)、白细胞介素-1β(IL-1β)、单核细胞趋化蛋白-1(MCP-1)和血管内皮生长因子(VEGF)),如美国专利号6,524,581(通过引用以其整体并入本文)中所述。
本文提供的方法还可用于确定受试者是否可能对以下血管生成抑制剂中的一种或多种有反应:干扰素γ1β、干扰素γ1β
Figure GDA0002040024300000541
与吡非尼酮、ACUHTR028、αVβ5、氨基苯甲酸钾、淀粉样蛋白P、ANG1122、ANG1170、ANG3062、ANG3281、ANG3298、ANG4011、抗CTGFRNAi、Aplidin、黄芪提取物与丹参和五味子、动脉粥样硬化斑块阻断剂、Azol、AZX100、BB3、***生长因子抗体、CT140、达那唑、艾思瑞(Esbriet)、EXC001、EXC002、EXC003、EXC004、EXC005、F647、FG3019、Fibrocorin、卵泡抑素、FT011、半乳凝素-3抑制剂、GKT137831、GMCT01、GMCT02、GRMD01、GRMD02、GRN510、Heberon Alfa R、干扰素α-2β、ITMN520、JKB119、JKB121、JKB122、KRX168、LPA1受体拮抗剂、MGN4220、MIA2、微小RNA 29a寡核苷酸、MMI0100、诺斯卡品、PBI4050、PBI4419、PDGFR抑制剂、PF-06473871、PGN0052、Pirespa、Pirfenex、吡非尼酮、普利提环肽(plitidepsin)、PRM151、Px102、PYN17、PYN22与PYN17、Relivergen、rhPTX2融合蛋白、RXI109、胰泌素、STX100、TGF-β抑制剂、转化生长因子、β-受体2寡核苷酸、VA999260、XV615或其组合。
在另一个实施方案中,提供了一种用于确定受试者是否可能对一种或多种内源性血管生成抑制剂有反应的方法。在另外的实施方案中,内源性血管生成抑制剂是内皮抑素、源自XVIII型胶原的20kDa C-末端片段、血管抑素(胞浆素的38kDa片段)、血小板反应蛋白(TSP)蛋白家族的成员。在另外的实施方案中,该血管生成抑制剂是TSP-1、TSP-2、TSP-3、TSP-4和TSP-5。还提供了用于确定对以下血管生成抑制剂中的一种或多种有反应的可能性的方法:可溶性VEGF受体,例如可溶性VEGFR-1和神经毡蛋白1(NPR1)、血管生成素-1、血管生成素-2、血管形成抑制素、钙网蛋白、血小板因子-4;金属蛋白酶组织抑制剂(TIMP)(例如,TIMP1、TIMP2、TIMP3、TIMP4);软骨衍生的血管生成抑制剂(例如,肌钙蛋白肽I和chrondomodulin I);具有血小板反应蛋白基序1的解整合素和金属蛋白酶;干扰素(IFN)(例如,IFN-α、IFN-β、IFN-γ);趋化因子,例如具有C-X-C基序的趋化因子(例如,CXCL10,也称为干扰素γ诱导的蛋白质10或小的诱导型细胞因子B10);白细胞介素细胞因子(例如,IL-4、IL-12、IL-18);凝血素;抗凝血酶III片段;催乳素;由TNFSF15基因编码的蛋白质;骨桥蛋白;乳腺丝抑蛋白;血管能抑素;增殖素相关蛋白。
在一个实施方案中,提供了用于确定对以下血管生成抑制剂中的一种或多种有反应的可能性的方法:血管生成素-1、血管生成素-2、血管抑素、内皮抑素、血管形成抑制素、血小板反应蛋白、钙网蛋白、血小板因子-4、TIMP、CDAI、干扰素α、干扰素β、血管内皮生长因子抑制剂(VEGI)meth-1、meth-2、催乳素、VEGI、SPARC、骨桥蛋白、乳腺丝抑蛋白、血管能抑素、增殖素相关蛋白(PRP)、网状内皮***刺激素(restin)、TSP-1、TSP-2、干扰素γ1β、ACUHTR028、αVβ5、氨基苯甲酸钾、淀粉样蛋白P、ANG1122、ANG1170、ANG3062、ANG3281、ANG3298、ANG4011、抗CTGF RNAi、Aplidin、黄芪提取物与丹参和五味子、动脉粥样硬化斑块阻断剂、Azol、AZX100、BB3、***生长因子抗体、CT140、达那唑、艾思瑞(Esbriet)、EXC001、EXC002、EXC003、EXC004、EXC005、F647、FG3019、Fibrocorin、卵泡抑素、FT011、半乳凝素-3抑制剂、GKT137831、GMCT01、GMCT02、GRMD01、GRMD02、GRN510、Heberon Alfa R、干扰素α-2β、ITMN520、JKB119、JKB121、JKB122、KRX168、LPA1受体拮抗剂、MGN4220、MIA2、微小RNA 29a寡核苷酸、MMI0100、诺斯卡品、PBI4050、PBI4419、PDGFR抑制剂、PF-06473871、PGN0052、Pirespa、Pirfenex、吡非尼酮、普利提环肽(plitidepsin)、PRM151、Px102、PYN17、PYN22与PYN17、Relivergen、rhPTX2融合蛋白、RXI109、胰泌素、STX100、TGF-β抑制剂、转化生长因子、β-受体2寡核苷酸、VA999260、XV615或其组合。
在又另一个实施方案中,血管生成抑制剂可以包括帕唑帕尼(Votrient)、舒尼替尼(Sutent)、索拉非尼(Nexavar)、阿西替尼(Inlyta)、帕纳替尼(Iclusig)、凡德他尼(vandetanib)(Caprelsa)、卡博替尼(Cometrig)、雷莫芦单抗(Cyramza)、瑞格拉非尼(Stivarga)、阿柏西普(ziv-aflibercept)(Zaltrap)、莫特塞尼(motesanib)或其组合。在另一个实施方案中,血管生成抑制剂是VEGF抑制剂。在另外的实施方案中,该VEGF抑制剂是阿西替尼、卡博替尼、阿柏西普(aflibercept)、布立尼布、tivozanib、雷莫芦单抗或莫特塞尼。在又另外的实施方案中,血管生成抑制剂是莫特塞尼。
在一个实施方案中,本文提供的方法涉及确定受试者对血小板衍生生长因子(PDGF)家族成员的拮抗剂(例如,抑制、减少或调节PDGF受体(PDGFR)的信号传导和/或活性的药物)有反应的可能性。例如,在一个实施方案中,PDGF拮抗剂是抗PDGF适体、抗PDGF抗体或其片段、抗PDGFR抗体或其片段、或小分子拮抗剂。在一个实施方案中,PDGF拮抗剂是PDGFR-α或PDGFR-β的拮抗剂。在一个实施方案中,该PDGF拮抗剂是抗PDGF-β适体E10030、舒尼替尼、阿西替尼、索拉菲尼、伊马替尼、甲磺酸伊马替尼、尼达尼布、盐酸帕唑帕尼、帕纳替尼、MK-2461、多韦替尼、帕唑帕尼、crenolanib、PP-121、替拉替尼、伊马替尼、KRN 633、CP673451、TSU-68、Ki8751、amuvatinib、tivozanib、马赛替尼、二磷酸莫替沙尼、、多韦替尼二乳酸、利尼伐尼(linifanib)(ABT-869)。
免疫疗法
在一个实施方案中,本文提供了用于通过以下方式确定鳞状细胞癌(SQ)肺癌患者是否可能对免疫疗法有反应的方法:确定从患者获得的样品的SQ亚型,并且基于该SQ肺癌亚型评估患者是否可能对免疫疗法有反应。在另一个实施方案中,本文提供了通过以下方式选择患有SQ的患者以接受免疫疗法的方法:确定来自患者的样品的SQ亚型,并且基于该SQ亚型选择患者以接受免疫疗法。可以使用本领域已知的对SQ亚型分型的任何方法来进行从患者获得的样品的SQ亚型的确定。在一个实施方案中,从患者获得的样品先前已被诊断为SQ,并且将本文提供的方法用于确定该样品的SQ亚型。先前的诊断可以是基于组织学分析。组织学分析可以由一名或多名病理学家进行。在一个实施方案中,通过一组或一小组生物标记物或其子集的基因表达分析以便产生表达谱来进行SQ亚型分型。可以对从患者获得的肺癌样品(例如,肺癌SQ样品)进行基因表达分析,以便确定选自本文所述的可公开获得的肺癌数据库和/或本文提供的表1的一种或多种生物标记物的表达的存在、不存在或水平。SQ亚型可以选自由原发型、经典型、分泌型和基底型组成的组。免疫疗法可以是本文提供的任何免疫疗法。在一个实施方案中,免疫疗法包括给予一种或多种检查点抑制剂。该检查点抑制剂可以是本文提供的任何检查点抑制剂,如例如靶向PD-1、PD-LI或CTLA4的检查点抑制剂。
如本文所公开,生物标记物小组或其子集可以是在任何一个或多个可公开获得的SQ基因表达数据集中披露的那些。在一个实施方案中,肺癌是SQ,并且生物标记物小组或其子集是例如TCGA肺SQ RNAseq基因表达数据集(n=501)。在一个实施方案中,肺癌是SQ,并且生物标记物小组或其子集是例如Lee等人(Cancer Res 2008;14(22):7397-7404,将其内容通过引用以其整体并入本文)中披露的SQ基因表达数据集(n=75)。在一个实施方案中,肺癌是SQ,并且生物标记物小组或其子集是例如Raponi等人(Cancer Res 2006;66(7):466-472,将其内容通过引用以其整体并入本文)中披露的SQ基因表达数据集(n=130)。在一个实施方案中,肺癌是SQ,并且生物标记物小组或其子集是例如Wilkerson等人(ClinCancer Res 2010;16(19):4864-4875,将其内容通过引用以其整体并入本文)中披露的SQ基因表达数据集(n=56)。在一个实施方案中,肺癌是SQ,并且生物标记物小组或其子集是例如表1中公开的SQ基因表达数据集。在表2中,该表的第一列表示用于区分基底型的生物标记物列表。该表的第二列表示用于经典型的生物标记物列表。该表的第三列表示用于区分原发型的生物标记物列表。该表的最后一列表示用于区分分泌型的生物标记物列表。在一些情况下,如表2中所示,可以将总共80种生物标记物用于SQ亚型确定。对于表2中的每种SQ亚型,20种生物标记物中的10种可以是负相关基因,而10种可以是可以被选择作为特定SQ亚型的基因标签的正相关基因。
在一些实施方案中,用于肺癌亚型分型(例如,SQ亚型分型)的方法包括检测分类器生物标记物组的表达水平。分类器生物标记物组可以是来自可公开获得的数据库的一组生物标记物,如例如一个或多个TCGA肺SQ RNASeq基因表达数据集或本文提供的任何其他数据集。在一些实施方案中,检测包括在核酸水平或蛋白质水平上的表1的所有分类器生物标记物或本文提供的任何其他数据集。在另一个实施方案中,检测表1的单个分类器生物标记物或表1的分类器生物标记物的子集或本文提供的任何其他数据集,例如从约五种至约二十种。在另一个实施方案中,检测表1的单个分类器生物标记物或表1的分类器生物标记物的子集和/或本文提供的任何其他数据集,例如从约20种至约80种。在另一个实施方案中,检测表1的所有分类器生物标记物或本文提供的任何其他数据集。在另一个实施方案中,检测表1的至少一种或所有分类器生物标记物与本文提供的任何其他SQ数据集的一种或多种分类器生物标记物的组合。例如使用对分类器生物标记物有特异性的引物和/或探针、和/或类似物,可以通过任何合适的技术(包括但不限于RNA-seq、逆转录酶聚合酶链反应(RT-PCR)、微阵列杂交测定、或另一种杂交测定(例如纳米串测定))来进行检测。在一些情况下,可用于扩增方法(例如,RT-PCR或qRT-PCR)的引物是适合用于单独地或组合地与来自本文提供的数据集的分类器基因结合的任何正向和反向引物。
在一个实施方案中,在如本文提供的确定肺癌亚型的方法中检测了在本文提供的任何SQ基因表达数据集(包括例如,针对SQ肺样品的表1)中的从约1种至约5种、约5种至约10种、从约5种至约15种、从约5种至约20种、从约5种至约25种、从约5种至约30种、从约5种至约35种、从约5种至约40种、从约5种至约45种、从约5种至约50种、从约5种至约55种、从约5种至约60种、从约5种至约65种、从约5种至约70种、从约5种至约75种、或从约5种至约80种生物标记物。在另一个实施方案中,在如本文提供的确定肺癌亚型的方法中检测了来自本文提供的SQ基因表达数据集中的任何一个(包括例如针对SQ肺样品的表1)的每种生物标记物。
在一个实施方案中,本文提供的方法还包括确定SQ亚型中免疫激活的存在、不存在或水平。可以通过创建表达谱或检测与从患者获得的样品(例如,肺癌样品)中的每种SQ亚型相关的先天性免疫细胞和/或适应性免疫细胞相关的一种或多种生物标记物的表达来确定免疫细胞活化的存在或水平。在一个实施方案中,通过监测Bindea等人(Immunity2013;39(4);782-795,将其内容通过引用以其整体并入本文)的免疫细胞标签来确定与SQ亚型相关的免疫细胞活化。在一个实施方案中,该方法还包括测量单基因免疫生物标记物,如例如CTLA4、PDCD1和CD274(PD-LI)、PDCDLG2(PD-L2)和/或IFN基因标签。与SQ亚型相关的免疫激活(先天性和/或适应性)的存在或可检测水平可以指示或预测具有所述SQ亚型的患者可以修改为免疫疗法。免疫疗法可以是用如本文提供的检查点抑制剂进行的治疗。在一个实施方案中,SQ的原发亚型具有免疫表达。在一个实施方案中,本文提供了一种用于检测从患者获得的样品(例如,肺癌SQ样品)中的本文提供的至少一种分类器生物标记物的表达的方法,该方法还包括在所述样品中检测到如本文提供的免疫激活后给予免疫治疗剂。
在一个实施方案中,该方法包括确定肺癌SQ样品的亚型并随后确定所述亚型的免疫细胞活化的水平。在一个实施方案中,通过使用如本文所述的测序(例如,RNASeq)、扩增(例如,qRT-PCR)或杂交测定(例如,微阵列分析)确定一种或多种分类器生物标记物的表达水平来确定亚型。该一种或多种生物标记物可以选自可公开获得的数据库(例如,TCGA肺SQRNASeq基因表达数据集或本文提供的任何其他可公开获得的SQ基因表达数据集)。在一些实施方案中,可以将表1的生物标记物用于特异性确定从患者获得的SQ肺样品的亚型。在一个实施方案中,通过测量免疫标记物的基因表达标签来确定免疫细胞活化的水平。可以在用于对如本文所述的肺癌样品进行亚型分型的相同和/或不同样品中测量免疫标记物。可以测量的免疫标记物可以包含先天性免疫细胞(IIC)和/或适应性免疫细胞(AIC)基因标签、干扰素(IFN)基因标签、个体免疫标记物、主要组织相容性复合物II类(MHC II类)基因或其组合,由其组成或基本上由其组成。IIC和AIC两者的基因表达标签可以是本领域已知的所述细胞类型的任何已知基因标签。例如,免疫基因标签可以是来自Bindea等人(Immunity 2013;39(4);782-795)的那些。在一个实施方案中,用于在本文提供的方法中使用的免疫标记物选自表4A和/或表4B。个体免疫标记物可以是CTLA4、PDCD1和CD274(PD-L1)。在一个实施方案中,用于在本文提供的方法中使用的个体免疫标记物选自表5。免疫标记物可以是一种或多种干扰素(INF)基因。在一个实施方案中,用于在本文提供的方法中使用的免疫标记物选自表6。免疫标记物可以是一种或多种MHCII基因。在一个实施方案中,用于在本文提供的方法中使用的免疫标记物选自表7。在又另一个实施方案中,用于在本文提供的方法中使用的免疫标记物选自表4A、表4B、表5、表6、表7、或其组合。
Figure GDA0002040024300000601
Figure GDA0002040024300000611
Figure GDA0002040024300000621
Figure GDA0002040024300000631
Figure GDA0002040024300000641
Figure GDA0002040024300000651
Figure GDA0002040024300000661
Figure GDA0002040024300000671
Figure GDA0002040024300000681
Figure GDA0002040024300000691
Figure GDA0002040024300000701
Figure GDA0002040024300000711
Figure GDA0002040024300000721
Figure GDA0002040024300000731
Figure GDA0002040024300000741
Figure GDA0002040024300000751
Figure GDA0002040024300000761
Figure GDA0002040024300000771
Figure GDA0002040024300000781
Figure GDA0002040024300000791
表5.用于在本文提供的方法中使用的个体免疫标记物。
基因名称 缩写 GenBank登录号*
程序性死亡配体1 PDL1 NM_014143
程序性死亡配体2 PDL2 AY254343
程序性细胞死亡1 PDCD1 NM_005018
细胞毒性T淋巴细胞相关蛋白4 CTLA4 NM_005214
*每个GenBank登录号是所列基因的代表性或示例性GenBank登录号,并且出于所有目的将其通过引用以其整体并入本文。此外,每个列出的代表性或示例性登录号不应解释为将权利要求限制为特定登录号。
表6.用于在本文提供的方法中使用的干扰素(IFN)基因。
Figure GDA0002040024300000801
*每个GenBank登录号是所列基因的代表性或示例性GenBank登录号,并且出于所有目的将其通过引用以其整体并入本文。此外,每个列出的代表性或示例性登录号不应解释为将权利要求限制为特定登录号。
表7.用于在本文提供的方法中使用的MHC II类基因。
Figure GDA0002040024300000802
Figure GDA0002040024300000811
*每个GenBank登录号是所列基因的代表性或示例性GenBank登录号,并且出于所有目的将其通过引用以其整体并入本文。此外,每个列出的代表性或示例性登录号不应解释为将权利要求限制为特定登录号。
在一个实施方案中,在使用如本文提供的任何方法和分类器生物标记物小组或其子集确定患者的SQ肺癌亚型(单独或者组合确定如本文提供的一种或多种免疫细胞标记物的表达)时,选择患者以用免疫治疗剂进行治疗或给予免疫治疗剂。该免疫治疗剂可以是检查点抑制剂、单克隆抗体、生物反应调节剂、治疗性疫苗或细胞免疫疗法。
在另一个实施方案中,免疫治疗剂是检查点抑制剂。在一些情况下,提供了一种用于确定对一种或多种检查点抑制剂有反应的可能性的方法。在一个实施方案中,该检查点抑制剂是PD-1/PD-LI检查点抑制剂。该PD-1/PD-LI检查点抑制剂可以是纳武单抗、派姆单抗、阿特珠单抗(atezolizumab)、度伐单抗、拉立珠单抗(lambrolizumab)或阿维鲁单抗(avelumab)。在一个实施方案中,该检查点抑制剂是CTLA-4检查点抑制剂。该CTLA-4检查点抑制剂可以是伊匹单抗(ipilimumab)或tremelimumab。在一个实施方案中,该检查点抑制剂是检查点抑制剂的组合,如例如,与一种或多种CTLA-4检查点抑制剂组合使用的一种或多种PD-1/PD-LI检查点抑制剂的组合。
在一个实施方案中,免疫治疗剂是单克隆抗体。在一些情况下,提供了一种用于确定对一种或多种单克隆抗体有反应的可能性的方法。单克隆抗体可以针对肿瘤细胞或针对肿瘤产物。单克隆抗体可以是帕尼单抗、马妥珠单抗、necitumunab、曲妥珠单抗、阿麦妥昔单抗(amatuximab)、贝伐单抗、雷莫芦单抗、巴维昔单抗、patritumab、rilotumumab、西妥昔单抗、immu-132或登西珠单抗(demcizumab)。
在又另一个实施方案中,免疫治疗剂是治疗性疫苗。在一些情况下,提供了一种用于确定对一种或多种治疗性疫苗有反应的可能性的方法。该治疗性疫苗可以是肽或肿瘤细胞疫苗。该疫苗可以靶向MAGE-3抗原、NY-ESO-1抗原、p53抗原、存活素抗原或MUC1抗原。治疗性癌症疫苗可以是GVAX(GM-CSF基因转染的肿瘤细胞疫苗)、belagenpumatucel-L(用TGF-β2反义质粒修饰的四个经辐射的NSCLC细胞系制备的同种异体肿瘤细胞疫苗)、MAGE-A3疫苗(由MAGE-A3蛋白和佐剂AS15构成)、(l)-BLP-25抗MUC-1(靶向肿瘤细胞上表达的MUC-1)、CimaVax EGF(由与载体蛋白质偶联的人重组表皮生长因子(EGF)构成的疫苗)、WT1肽疫苗(由四个维尔姆斯(Wilms)肿瘤抑制基因类似物肽构成)、CRS-207(编码人间皮素的活减毒单核细胞增多性李斯特菌载体)、Bec2/BCG(诱导抗GD3抗体)、GV1001(靶向人端粒酶逆转录酶)、tergenpumatucel-L(由经遗传修饰以包括免疫***对其强烈反应的小鼠基因的人肺癌细胞构成)、TG4010(靶向MUC1抗原)、racotumomab(模仿在多种人类癌症上表达的NGcGM3神经节苷脂的抗独特型抗体)、tecemotide(脂质体BLP25;由MUC1的串联重复区域制成的基于脂质体的疫苗)或DRibbles(由九种癌症抗原加TLR佐剂制成的疫苗)。
在一个实施方案中,免疫治疗剂是生物反应调节剂。在一些情况下,提供了一种用于确定对一种或多种生物反应调节剂有反应的可能性的方法。该生物反应调节剂可能引发炎症,如例如PF-3512676(CpG 7909)(toll样受体9激动剂)、CpG-ODN 2006(下调Treg)、卡介苗(Bacillus Calmette-Guerin,BCG)、母牛分枝杆菌(SRL172)(现在经常作为佐剂进行测试的非特异性免疫刺激剂)。该生物反应调节剂可以是细胞因子疗法,如例如IL-2+肿瘤坏死因子α(TNF-α)或干扰素α(诱导T细胞增殖)、干扰素γ(诱导肿瘤细胞凋亡)或Mda-7(IL-24)(Mda-7/IL-24诱导肿瘤细胞凋亡并抑制肿瘤血管生成)。该生物反应调节剂可以是集落刺激因子,如例如粒细胞集落刺激因子。该生物反应调节剂可以是多模式效应物,如例如多靶VEGFR:沙利度胺及类似物如来那度胺和泊马度胺、环磷酰胺、环孢菌素、地尼白介素(denileukin diftitox)、talactoferrin、trabecetedin或全反式视黄酸。
在一个实施方案中,免疫疗法是细胞免疫疗法。在一些情况下,一种用于确定对一种或多种细胞治疗剂有反应的可能性的方法。细胞免疫治疗剂可以是树突细胞(DC)(离体产生的负载肿瘤抗原的DC疫苗)、T细胞(离体产生的淋巴因子激活的杀伤细胞;细胞因子诱导的杀伤细胞;活化的T细胞;γδT细胞)或自然杀伤细胞。
在一些情况下,SQ的特定亚型具有不同水平的免疫激活(例如,先天性免疫力和/或适应性免疫力),使得具有升高的或可检测的免疫激活(例如,先天性免疫力和/或适应性免疫力)的亚型被选择以接受用本文所述的一种或多种免疫治疗剂进行的治疗。在一个实施方案中,与其他SQ亚型或肺癌亚型相比,SQ的经典亚型具有低的免疫激活。在一些情况下,SQ的特定亚型具有高水平或升高水平的免疫激活。在一些情况下,与其他SQ亚型或肺癌亚型相比,SQ的分泌亚型具有升高水平的免疫激活(例如,先天性免疫力和/或适应性免疫力)。在一个实施方案中,不选择具有低水平免疫激活或无免疫激活(例如,先天性免疫力和/或适应性免疫力)的SQ亚型用于接受用本文所述的一种或多种免疫治疗剂进行的治疗。
检测方法
在一个实施方案中,本文提供的方法和组合物允许检测从受试者获得的肺癌样品(例如,鳞状细胞癌肺癌样品)中的至少一种核酸。该至少一种核酸可以是本文提供的分类器生物标记物。在一个实施方案中,使用本文提供的方法和组合物检测的该至少一种核酸选自表1。在一个实施方案中,检测从受试者获得的肺癌样品中的一种或多种核酸(例如,分类器生物标记物)的方法包括使用本文提供的任何方法测量至少一种或多种生物标记物的表达水平,基本上由其组成或由其组成。生物标记物可以选自表1。在一些情况下,该多种生物标记物核酸包含表1的至少两种生物标记物核酸、至少10种生物标记物核酸、至少20种生物标记物核酸、至少30种生物标记物核酸、至少40种生物标记物核酸、至少50种生物标记物核酸、至少60种生物标记物核酸、至少70种生物标记物核酸或所有80种生物标记物核酸,基本上由其组成或由其组成。该检测可以是在核酸水平。该检测可以通过使用本文公开的任何扩增、杂交和/或测序测定。
在另一个实施方案中,本文提供的方法和组合物允许检测从受试者获得的肺癌样品(例如,鳞状细胞癌肺癌样品)中的至少一种核酸或多种核酸,使得该至少一种核酸或该多种核酸选自表1中列出的生物标记物,或者允许从一组生物标记物中检测至少一种生物标记物,该生物标记物的存在、不存在和/或表达水平指示免疫激活。用于指示免疫激活的该组生物标记物可以是适应性免疫细胞(AIC)(例如,表4A)和/或先天性免疫细胞(IIC)(例如,表4B)的基因表达标签、个体免疫生物标记物(例如,表5)、干扰素基因(例如,表6)、主要组织相容性复合物II类(MHC II)基因(例如,表7)或其组合。IIC和AIC两者的基因表达标签可以是本领域已知的任何基因标签,如例如Bindea等人(Immunity 2013;39(4);782-795)中列出的基因标签。该检测可以是在核酸水平。该检测可以通过使用本文公开的任何扩增、杂交和/或测序测定。
试剂盒
可以进一步提供用于实践本发明的方法的试剂盒。“试剂盒”旨在是包含用于特异性检测本发明的生物标记物的表达的至少一种试剂(例如,抗体、核酸探针或引物等)的任何制品(例如,包装或容器)。该试剂盒可以作为用于执行本发明方法的单元进行促销、分发或销售。另外,该试剂盒可以包含描述该试剂盒及其使用方法的包装说明书。
在一个实施方案中,提供了用于实践本发明方法的试剂盒。此类试剂盒与手动和自动免疫细胞化学技术(例如,细胞染色)兼容。这些试剂盒包含针对感兴趣的生物标记物的至少一种抗体、用于检测与生物标记物结合的抗体的化学品、复染剂和任选地上蓝剂(以促进阳性染色细胞的鉴定)。检测抗原-抗体结合的任何化学品都可以用于本发明的实践中。该试剂盒可以包含至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、或更多种抗体,用于在本发明的方法中使用。
实施例
通过参考以下实施例来进一步展示本发明。但是,应注意的是这些实施例,像以上所述的实施方案一样,是说明性的并且不以任何方式构成对本发明范围的限制。
实施例1-肺鳞状细胞癌内在亚型之间的免疫细胞活化差异和与CD274(PD-L1)表达的可变相关性。
介绍
基于基因表达的肺鳞状细胞癌(SQ)亚型分型将SQ肿瘤分类为具有不同生物学和临床特征的不同亚型。基于基因表达的亚型分型一致地鉴定了4种肺SQ亚型:原发型、经典型、基底型和分泌型(1,2)(参见图1)。Sq亚型展示了基因组改变、肿瘤驱动因素、预后以及可能对各种疗法的反应的关键差异(1-2)。
方法
使用以前公布的Bindea等人(3)免疫细胞基因标签(总共24种)和SQ亚型分型基因表达标签(1-2),针对与SQ亚型相关的免疫细胞特征检查了几个可公开获得的肺SQ数据集(1-2和4-5)(参见图2)。对亚型的免疫差异的这种研究使用了来自Bindea等人[3]的24种免疫细胞基因标签,该24种免疫细胞基因标签的每种标签都有不同数量的基因并被分类为适应性或先天性免疫细胞标签(参见表4A-表4B)。适应性免疫细胞(AIC)标签(表4A)包括T细胞、中枢记忆T细胞(Tcm)、效应记忆T细胞(Tem)、T辅助细胞(Th)、1型T辅助细胞(Th1)、2型T辅助细胞(Th2)、T滤泡辅助细胞(Tfh)、T辅助17细胞(Th17)、T调节细胞(Treg)、γδT细胞(Tgd)、CD8T细胞、细胞毒性T细胞、B细胞,并且先天性免疫细胞(IIC)标签(表4B)包括自然杀伤(NK)、NK CD56暗细胞、NK CD56亮细胞、树突细胞(DC)、未成熟树突细胞(iDC)、树突细胞(pDC)、活化树突细胞(aDC)、肥大细胞、嗜酸性粒细胞、巨噬细胞和嗜中性粒细胞。除了先天性免疫细胞(IIC)和适应性免疫细胞(AIC)两者的基因表达标签以外,在4种SQ亚型(原发型、经典型、分泌型、基底型)中还检查了13种基因IFN标签(IFN;表6)、13种基因MHC II类标签得分(Forero[6];表7)以及表5中的单基因免疫生物标记物(CTLA4、PDCD1、CD274(PD-L1)、和PDCDLG2(PD-L2))。
对于SQ,使用了共有762名患者的肺鳞状细胞癌样品的4个已公布的基因表达数据集,包括TCGA[2]、Lee等人[4]、Raponi等人[5]、和Wilkerson等人[1]。对于TCGA,从Firehose下载上四分位数归一化RSEM数据并进行log2变换。从GEO下载Lee等人[4](GSE8894)和Raponi等人[5](GSE4573)的归一化Affy阵列数据,并从GEO下载Wilkerson等人[1](GSE17710)的归一化Agilent阵列数据。
为了确定鳞状细胞癌亚型(基底型、经典型、原发型、分泌型),使用如先前在Wilkerson等人[1]中所述的公布的208种基因最近质心分类器。在标签中的基因中值中心之后,为每个样品分配对应于与其最大相关的质心的亚型。(皮尔逊)
使用鳞状细胞癌的TCGA数据,通过绘制成对Spearman秩相关系数的矩阵来评估30种标记物之间的相关性,其中标记物通过分级聚类排序(参见图4)。为了按照亚型研究总体免疫标记物趋势,绘制表达热图,其中样品按照亚型排列并且标记物根据Bindea等人[3]中的排序进行分组(参见图3)。为了评价亚型之间免疫标记物差异的再现性,针对每个数据集按照亚型绘制归一化T细胞标签(参见图5)。
使用线性回归评价免疫细胞标签与肿瘤亚型和与CD274表达的关联。更具体地,为了评估亚型作为免疫标记物预测因子相对于PD-L1的预测因子的预测强度,在TCGA数据集中拟合每个标签用亚型作为唯一预测因子和再用PD-L1作为唯一预测因子的线性回归模型。PD-L1表达被视为低/中/高分类变量,其在每组中具有相等比例。检查当亚型是预测因子时调整的R平方相对于当PD-L1是预测因子时调整的R平方的散点图的总体趋势(参见图6)。
使用来自TCGA鳞状细胞癌的补充信息(Lawrence 2013)中可获得的每Mb数据的非沉默突变负荷,分别使用Kruskal Wallis检验和Spearman相关系数研究突变负荷-T细胞表达的关联。对于TCGA鳞状细胞癌,使用Kruskal Wallis检验评价NFE2L2-亚型关联。为了测试SQ中的NFE2L2在针对亚型调整后是否显示关联的证据,将T细胞表达的线性模型与SQ中的NFE2L2表达作为唯一预测因子拟合,并且在针对亚型调整后再次拟合。
使用Kruskal-Wallis检验研究亚型和免疫标签与13种基因MHC Ii类标签的关联[Forero[6];表7](计算为列表(表7)中的所有基因的平均值)。对于免疫标签-MHC II类关联,计算Spearman相关系数。
还分析了免疫标签的分级聚类和成对标签相关性。使用分层cox比例风险模型评价第I-III阶段样品的存活标签关联,从而允许每个数据集中的不同基线风险。更具体地,使用Cox比例风险模型,在每种亚型内对TCGA数据集中的免疫标记物-存活关联进行总体和单独测试。将免疫标记物集中并按比例缩放以具有平均值0和方差1,并且排除第IV阶段患者。针对阶段调整的特定亚型内的评价,并针对阶段和亚型调整总体评价。制作显示每种标签的风险比和置信区间的森林图(参见图7A和图7B)。使用R 3.2.0软件(http://www.R-project.org)进行所有统计分析。
结果
免疫细胞基因标签的热图分析和无监督分级聚类提供了SQ的内在亚型的分离(参见图3和图4)。对免疫细胞基因标签(AIC和IIC两者)以及个体免疫基因标记物的检查揭示了SQ亚型之间的明显差异(参见图3)。
在SQ亚型之间,分泌亚型显示出先天性免疫细胞和适应性免疫细胞两者的始终较高的免疫细胞表达,除了Th2标签,其中原发型和分泌型两者具有相当的表达(图21)。经典亚型表现出所有SQ亚型的最低免疫细胞表达。与AD亚型的情况不同,CD274(PD-L1)表达与SQ亚型中的其他免疫细胞表达无关。这在经典亚型中尤其明显,其中尽管其他免疫细胞的表达相对较低,但CD274(PD-L1)表达很高(参见图3和图21)。总体而言,免疫激活在SQ的分泌亚型中最为突出,证明了先天性免疫细胞以及适应性免疫细胞两者的激活。相反,SQ的经典亚型表现出较低的免疫激活。
使用分级聚类,相关性矩阵揭示了适应性免疫细胞和先天性免疫细胞的聚类(参见图4)。在SQ中,适应性免疫特征例如T细胞、细胞毒性细胞、CD8细胞、Th1细胞、PDCD1、CTLA4和Treg具有高的成对相关性,并且类似地,对于先天性免疫细胞(包括iDC、DC、巨噬细胞、嗜中性粒细胞、肥大细胞和嗜酸性粒细胞)是相关的(图4)。此外,在SQ中,与先天免疫细胞相比,NK CD56暗细胞(细胞溶解活性)与适应性免疫细胞更强烈相关(参见图4)。此外,在SQ中,TFH和B细胞与适应性免疫特征更高度相关(参见图4)。
与SQ亚型相比,进行了CD274(PD-L1)表达与适应性免疫细胞标签的关联强度分析。如图6中所示,在SQ肿瘤中,针对所有检查的适应性免疫细胞,亚型是比CD274(PD-L1)表达更好的免疫细胞表达预测因子(中值F检验p值和经调整的R平方是2.16e-24和0.20(对于亚型)与1.86e-09和0.07(对于CD274))。
免疫细胞标签主要在TCGA数据集中评价,然而发现如通过免疫细胞标签测量的,SQ亚型免疫差异在多个数据集中是非常可再现的(参见图5)。SQ亚型中的T细胞免疫细胞标签表达亚型差异在多个基因表达数据集中具有显著的可再现性,该基因表达数据集源自冷冻样品和FFPE样品两者并且涉及多个基因表达平台包括RNAseq(Illumina,San Diego,CA)和来自Affymetrix(Santa Clara,CA)和Agilent(Santa Clara,CA)两者的微阵列。总体而言,免疫细胞标签基因表达模式在多个SQ(参见图5)数据集中是一致的。
在SQ中,非沉默突变负荷在亚型之间没有显著差异(参见图22)。在SQ数据集中,突变负荷与T细胞免疫细胞表达不强烈相关(在SQ中Spearman相关性=-0.08)。
几个其他基因组特征例如SQ中的KEAP/NFE2L2改变(Hast[7])已被认为是NSCLC中免疫应答降低的可能原因。影响氧化应激途径的KEAP/NFE2L2改变在SQ经典亚型中富集(图22)。如通过SQ中增加的NFE2L2表达测量的环加氧酶2(COX2)途径的改变与较低的免疫细胞表达相关,然而在使用线性回归针对亚型调整后,NFE2L2是显著的预测因子(在针对亚型调整后,SQ中的NFE2L2表达p=1.2E-07至p=0.47)。
使用公布的13种基因MHC II类标签(Forero[6])研究SQ肺癌中的免疫细胞表达与MHC II类基因的关联。MHC II类基因表达与SQ中的几种免疫细胞强烈相关,包括T细胞表达(SQ中的Spearman相关性=0.86)、B细胞表达(SQ中的Spearman相关性=0.69)和DC表达(SQ中的Spearman相关性=0.76)。在肿瘤邻近正常肺组织中的MHC II类基因表达与肿瘤相比显著更高,并且在肿瘤亚型中差异表达(图22)。在作为T细胞免疫细胞表达预测因子的MHCII类标签的线性模型中,在针对SQ亚型调整后MHC II类仍然显著(对于MHC II,p<1E-50)。
使用cox比例风险模型,计算增加一个表达单位的亚型特异性风险比(HR)。针对病理阶段调整亚型特异性HR,并计算置信区间(CI)。在图7A-图7B中显示了对于至少一种亚型显著(标称p值<0.05)的标记物的风险比和置信区间。在图7A-图7B中显示了针对一种或多种亚型显示显著存活关联的细胞标签或基因的HR和CI。在SQ亚型之间,Th1、Th2、TFH、DC、巨噬细胞、肥大细胞、和MHC II类的表达的单位增加在原发亚型中与改善的存活显著相关(图7A-7B)。奇怪的是,分泌亚型没有显示出与存活的显著关联,这可能是由于分泌亚型中免疫细胞的一致高的表达阻止了展示出每单位增加的增量存活益处。在SQ中,仅原发亚型表现出免疫细胞表达与改善的存活的显著关联(p<0.01)(参见图7A-图7B)。
结论
肺SQ基因表达亚型在其免疫景观方面不同。SQ的内在生物学亚型揭示了免疫细胞活化的关键差异,其不总是与CD274表达相关并且表现出与存活的可变关联。SQ经典亚型显示出最小的免疫浸润(受抑制的免疫细胞表达),表明对immunoRX的反应降低,而分泌亚型在SQ肿瘤亚型之间显示出升高的免疫表达。在SQ中,亚型似乎是比CD274(PD-LI)更好的免疫浸润预测因子。CD274表达既与AIC表达无关,又与SQ中的改善的存活无关。SQ原发亚型显示出与改善的存活相关的免疫特征表达。此外,非沉默突变负荷与亚型之间的免疫细胞表达不相关;然而,MHC II类基因表达高度相关。增加的免疫和MHC II基因表达与SQ的原发亚型中改善的存活相关。
通过引用并入
出于所有目的,以下参考文献通过引用以其整体并入。
1.)Wilkerson MD,et al.Clin Cancer Res 2010;16(19):4864-75.PMID20643781
2.)TCGA Lung SQCC.Nature 2012;489(7417):519-525.PMID 22960745
3.)Bindea et al.,Immunity 2013;39(4):782-95.PMID 24138885
4.)Lee ES,et al.Cancer Res 2008;14(22):7397-7404.PMID 19010856
5.)Raponi M,et al.Cancer Res 2006;66(7):466-72.PMID 16885343
6.)Forero A,Li Y,Dongquan C,et al.Expression of the MHC class IIpathway in triple negative breast cancer tumor cells is associated with agood prognosis and infiltrating lymphocytes.Cancer Immunol Res 2016;4(5):390-399.
7.)Hast BE,Cloer EW,Goldfarb D,et al.Cancer-derived mutations inKEAP1impair NRF2degradation but not ubiquitination.Cancer Res 2014;74(3):808-817.
实施例2-肺鳞状细胞癌亚型分型标签的开发和验证
目的
肺鳞状细胞癌(SQ)亚型分型主要限于如下研究方案,该研究方案涉及从新鲜冷冻肺肿瘤中提取RNA,随后使用超过200种基因的定量基因表达来应用最近质心预测因子。尽管有鳞状细胞癌亚型分型的预后和预测益处的证据,但是对新鲜冷冻组织的需求、需要>200种基因的基因表达结合复杂的生物信息学分析,阻碍了SQ亚型分型在药物开发和/或临床中的应用。这项研究的目的是开发用于区分鳞状细胞癌的四种亚型(即,基底、经典、分泌或原发亚型)的稳健而有效的基因标签(需要较少的基因)。新的有效基因标签可以用于从新鲜冷冻或FFPE肿瘤样品中可靠地对SQ亚型分型,使其适用于使用任何可获得的定量RNA平台(qRT-PCR、RNAseq、Affymetrix或Agilent阵列)进行诊断应用和/或药物开发。用于区分鳞状细胞癌亚型的80种基因标签的开发如本文的方法中所述进行。
方法
采用至最近质心阵列分类(CLaNC)[1]算法,测试了许多方法以确定包括在SQ亚型分型基因标签中的最佳基因数目。在一种方法(图8中的普通方法)中,将CLaNC不进行修改地应用于TCGA肺SQ RNAseq基因表达数据集(n=501)。在第二种方法(图8和图9中的50-50高低)中,将CLaNC进行修改地用于TCGA肺SQ RNAseq基因表达数据集(n=501),以为每种SQ亚型选择相等数量的负相关基因和正相关基因。在第三种方法(图8中的50-50但20k)中,将CLaNC进行修改地用于转录组数据集(n=20,000),以为每种SQ亚型选择相等数量的负相关基因和正相关基因。在最后一种方法(图8中的混合方法)中,将CLaNC进行修改地用于TCGA肺SQ RNAseq基因表达数据集(n=501),以为基底和分泌SQ亚型修饰相等数量的负相关基因和正相关基因,为原发SQ亚型选择许多负相关基因,并为经典SQ亚型选择许多正相关基因。基于对上述每种方法的5折交叉验证曲线的评价,选择包括在SQ标签中的最佳基因数目的检查(参见图8)。最终,选择50-50高低方法作为确定包括在SQ亚型分型基因标签中的最佳基因数目的方法。这种方法显示,每种亚型20种基因或总共80种基因的表达模式的检查可以用来精确地将SQ样品分型。
使用TCGA肺SQ RNAseq就用表达数据集(n=501)用于训练和208种基因分类器用于定义金标准亚型,开发了80种基因标签,其在应用于几个独立测试集时保持低错误分类率。从标准的208种分类器基因开始,进行修改地使用至最近质心阵列分类(CLaNC)[1]算法,以如上所述为每种亚型选择相等数量的负相关基因和正相关基因。基于使用TCGA肺SQ数据集进行的5折交叉验证曲线选择包括在标签中的基因的最佳数目(每种亚型20种)(参见图8和图9)。选择原型样品(图10)用于训练预测因子需要将CLaNC应用于整个TCGA数据集减去20%的具有最低金标准亚型预测强度的样品,从每种亚型中去除相等数量。从图11可以看出来自金标准208种基因分类器[2]中的80种基因标签的基因的基因等级。
然后在几个新鲜冷冻可公开获得的阵列和RNAseq数据集[2,3,4,5]中测试80种基因标签,并将结果与如由先前公布的208种基因标签[2]定义的金标准亚型称谓进行比较。然后在存档的FFPE鳞状细胞癌样品的新收集的RNAseq数据集中进行80种基因标签(表1)的最终验证,以确保在FFPE样品中具有可比的性能。
为了验证所选的80种基因标签的一致性能,新收集的FFPE样品是肺鳞状细胞癌(SQ)残留存档样品(主要是手术样品),所述样品是在北卡罗来纳大学教堂山分校(NC)的IRB批准方案下收集的。由病理学家审查样品的肿瘤细胞,并且在提取之前宏观切开三个10μm组织切片以富集肿瘤细胞。将RNA定量并且每个样品输入100ng。使用Illumina RNA-Access试剂盒构建富集转录组的测序文库。通过使用BA分析仪对测序文库进行质量控制,并使用qPCR进行定量。在Illumina RNA-Access平台(50bp PE,20-30百万读数)上生成序列数据,并且通过使用fastQC进行质量控制。使用STAR比对器将序列结果与hg19参考序列比对,并使用Cufflinks构建转录组[6]。使用cuff compare来注释转录组并计算各种表达基因的计数。根据癌症基因组图集肺鳞状细胞癌分析中使用的方法[3,7],将RSEM表达计数估计值进行上四分位数归一化和log2转化。
结果
表2中显示了这项研究中开发的80种基因标签基因列表,而每种SQ亚型的80种基因标签基因列表的T统计量可以在表1中找到。分别在图12、图13、图14和图15中显示了为每种SQ亚型(基底型、经典型、原发型、或分泌型)选择的20种基因的中值基因表达。在图16中显示了使用80种基因标签的亚型称谓与在几个不同的测试数据集中公布的208种基因标签亚型称谓的一致性。新开发的80种基因标签在其他4个测试数据集(图16)和新收集的FFPE样品(图16)中表现出在0.84-0.91范围内的一致性。以下是测试数据集、RNA平台类型和所使用的鳞状细胞癌样品数目的汇总。
Figure GDA0002040024300000921
结论
描述了用于SQ亚型分型的有效的80种基因标签的开发和验证。当应用于几个独立的测试集时,所得的80种基因标签保持低错误分类率。因此,新标签从新鲜冷冻或FFPE肿瘤样品中可靠地对AD亚型分型,并且可以使用从包括RNAseq和阵列在内的各种平台生成的基因表达数据可靠地执行。
通过引用并入
出于所有目的,以下参考文献通过引用以其整体并入。
1.)Dabney AR.ClaNC:Point-and-click software for classifyingmicroarrays to nearest centroids.Bioinformatics.2006;22:122–123.doi:10.1093/bioinformatics/bti756
2.)Wilkerson MD,et al.Clin Cancer Res 2010;16(19):4864-75.PMID20643781
3.)TCGA Lung SQCC.Nature 2012;489(7417):519-525.PMID 22960745
4.)Lee ES,et al.Cancer Res 2008;14(22):7397-7404.PMID 19010856
5.)Raponi M,et al.Cancer Res 2006;66(7):466-72.PMID 16885343
6.)Trapnell C,Williams BA,Pertea G,Mortazavi A,Kwan G,van Baren MJ,etal.Transcript assembly and quantification by RNA-Seq reveals unannotatedtranscripts and isoform switching during cell differentiation.Naturebiotechnology 2010;28(5):511-5.
7.)Li B,and Dewey CN.RSEM:accurate transcript quantification fromRNA-Seq data with or without a reference genome.BMC Bioinformatics 2011,12:323doi:10.1186/1471-2105-12-323
实施例3-如使用来自实施例2的肺鳞状细胞癌亚型分型80种基因标签所确定的肺鳞状细胞癌内在亚型之间的免疫细胞活化差异。
方法
使用以前公布的Bindea等人(1)免疫细胞基因标签(总共24种)和实施例2中描述的用于对SQ亚型分型的肺SQ亚型分型基因标签,针对与SQ亚型相关的免疫细胞特征检查了几个可公开获得的肺SQ数据集(2-5;参见图2)。在4种SQ亚型(基底型、经典型、原发型和分泌型)中检查了先天性免疫细胞(IIC)和适应性免疫细胞(AIC)两者的基因表达标签、13种基因IFN标签(IFN)、以及单基因免疫生物标记物(CTLA4、PDCD1、和CD274(PD-L1)、PDCDLG2(PD-L2))。使用线性回归评价免疫细胞标签与肿瘤亚型和与CD274表达的关联。还分析了免疫标签的分级聚类和成对标签相关性。使用分层cox比例风险模型评价第I-III阶段样品的存活标签关联,从而允许每个数据集中的不同基线风险。
结果
使用实施例2的TCGA SQ数据集和80种基因SQ亚型分型标签,免疫细胞基因标签的热图分析和无监督分级聚类以与实施例1中观察到的相似的方式提供SQ的内在亚型的分离(参见图3和图17)。此外,与在实施例1中观察到的相似,免疫细胞标签基因表达模式在多个SQ(参见图18)数据集中是一致的(参见图5)。如在实施例1中,与SQ亚型相比,进行了CD274(PD-L1)表达与适应性免疫细胞标签的关联强度分析。如图19中所示(与在图6中一样),在SQ肿瘤中,针对所有检查的适应性免疫细胞,亚型是比CD274(PD-L1)表达更好的免疫细胞表达预测因子。
如实施例1中所述,使用cox比例风险模型,计算增加一个表达单位的亚型特异性风险比。针对病理阶段调整亚型特异性HR,并计算置信区间。在图20中显示了针对一种或多种亚型显示显著存活关联的细胞标签或基因的HR和CI。在SQ亚型之间,Th1、Th2、TFH、DC、巨噬细胞、和肥大细胞的表达的单位增加在原发亚型中与改善的存活显著相关,非常像在实施例1中(参见图7A-7B和图20)。奇怪的是,分泌亚型没有显示出与存活的显著关联,这可能是由于分泌亚型中免疫细胞的一致高的表达阻止了展示出每单位增加的增量存活益处。总体而言,在SQ中,仅原发亚型表现出免疫细胞表达与改善的存活的显著关联(参见图7A-7B和图20)。
结论
在显示肺SQ亚型在其免疫景观中如何不同方面,实施例2中描述的用于SQ亚型分型的80种基因标签显示出与实施例1中使用的一种或多种SQ亚型分型基因标签相似的结果。与实施例1的SQ亚型分型基因标签一致,该实施例中使用的SQ亚型分型基因标签显示肺SQ基因表达亚型在其免疫景观方面不同。SQ的内在生物学亚型揭示了免疫细胞活化的关键差异,其不总是与CD274表达相关并且表现出与存活的可变关联。SQ经典亚型显示出最小的免疫浸润,表明对immunoRX的反应降低。在SQ中,亚型似乎是比CD274(PD-LI)更好的免疫浸润预测因子。CD274表达既与AIC表达无关,又与SQ中的改善的存活无关。SQ原发亚型显示出与改善的存活相关的免疫特征表达。
通过引用并入
出于所有目的,以下参考文献通过引用以其整体并入。
1.)Bindea et al.,Immunity 2013;39(4):782-95.PMID 24138885
2.)Wilkerson MD,et al.Clin Cancer Res 2010;16(19):4864-75.PMID20643781
3.)TCGA Lung SQCC.Nature 2012;489(7417):519-525.PMID 22960745
4.)Lee ES,et al.Cancer Res 2008;14(22):7397-7404.PMID 19010856
5.)Raponi M,et al.Cancer Res 2006;66(7):466-72.PMID 16885343
实施例4-鳞状细胞癌的表达亚型揭示了不同的免疫景观和独特的体细胞遗传特 征,表明了对多种药物靶标的差异性反应
介绍:基于基因表达的肺鳞状细胞癌(SQ)亚型分型将SQ肿瘤分类为具有可变结果和对疗法有潜在反应的不同亚型。基于基因表达的亚型分型一致地鉴定了4种肺SQ亚型:原发型、经典型、基底型和分泌型(1,2)(参见图1)。Sq亚型展示了基因组改变、肿瘤驱动因素、预后以及可能对各种疗法的反应的关键差异(1-2)。
方法:作为实施例1中进行的实验的后续,在使用图2中所示的TCGA肺癌基因表达数据集(SQ n=501)2确定的来自实施例1的肺SQ亚型中评价差异性药物靶基因表达。使用基因表达模式在实施例1中定义了先前公布的SQ亚型(原发型、经典型、分泌型、或基底型)。在这个实施例中,作为对免疫细胞基因标签(Bindea等人24种免疫细胞类型)4、单一免疫基因生物标记物(CTLA4、PDCD1(PD-1)、和CD274(PD-L1))的表达、增殖(11种基因标签;参见表9)5、和在实施例1中完成的非沉默突变负荷的检查的补充,根据来自实施例1的SQ亚型检查来自临床肿瘤学实体瘤突变小组(322种基因,参见表8)的基因的可变表达3。使用具有Bonferroni校正Kruskal-Wallis(KW)检验评估差异性基因表达,而将线性回归和Spearman相关性用于评价非沉默突变负荷、肿瘤亚型和CD274(PD-L1)表达与免疫细胞表达的关联。
结果:如图24中所示,观察到SQ亚型中208种/322种肿瘤小组基因244/322(76%)的可变表达(KW Bonferroni阈值p<0.000155)。大多数药物靶基因(包括但不限于SQ中的SOX2、TGFBR2、SMO、CSF1R、PIK3CA、和HGF)在各亚型中表现出强烈的差异性表达(p<1E-28)。此外,从表10可以看出,来自临床肿瘤学实体瘤突变小组的322种基因中的前25种基因在SQ亚型之间显示出差异性基因表达。免疫细胞表达在亚型之间也是高度可变的(参见图3)。SQCC分泌亚型表现出最大的免疫细胞表达,而SQ的经典亚型表现出低的免疫细胞表达(参见图3)。在SQ肿瘤中,亚型是比CD274(PD-L1)更好的免疫细胞表达预测因子(中值F检验p值和经调整的R平方是2.16e-24和0.20(对于亚型)与1.86e-09和0.07(对于CD274)(参见图6)。非沉默突变负荷与免疫细胞表达不强烈相关(在SQ中Spearman相关性=0.08)。总体而言,如图23中所示,在增殖、非沉默突变负荷、和关键药物靶标CD274(PD-L1)、PDCD1(PD-1)、和CTLA4方面存在显著的SQ亚型差异。SQ亚型在许多药物靶标肿瘤小组基因方面和在免疫细胞表达方面表现出显著差异,但在突变负荷方面没有表现出显著差异。
结论:肺SQ的分子亚型在临床实体瘤测序小组中包括的大多数关键药物靶基因的表达方面不同。肺SQ的分子亚型揭示了宿主免疫应答和免疫靶标的差异性表达。应该单独地并且与免疫细胞特征和关键突变靶标组合地研究亚型作为潜在生物标记物的药物敏感性的评价。
通过引用并入
出于所有目的,以下参考文献通过引用以其整体并入。
1.)Wilkerson MD,et al.Clin Cancer Res 2010;16(19):4864-75.PMID20643781
2.)TCGA Lung SQCC.Nature 2012;489(7417):519-525.PMID 22960745
3.)Foundation Medicine Solid Tumor Mutation Panel accessed October2014.
4.)Bindea et al.,Immunity 2013;39(4):782-95.PMID 24138885
5.)Neilson TO,et al.Clin Cancer Res 2010;16(21):522-5232.PMID20837693.
实施例5:肺鳞状细胞癌的表达亚型揭示了不同的免疫景观和独特的体细胞遗传特征,表明了对多种药物靶标的差异性反应
介绍:就像实施例4中一样,这个实施例的目的是评估临床上重要基因在先前定义的鳞状细胞癌(SQ)基因表达亚型中的差异性表达。与使用如实施例1中描述的TCGA肺癌基因表达数据集(SQ n=501)2进行基于基因表达的SQ亚型分型的实施例4相反,使用实施例2中描述的80个基因集进行这个实施例中基于基因表达的SQ亚型分型。此外,临床上重要的基因是322种基因(参见表8),其构成用于管理肿瘤学患者的临床实体瘤突变测序小组以鉴定影响治疗管理的基因组改变和/或确定靶向药物临床试验的合格性。就像实施例4中一样,还使用11种基因增殖标签(参见表9)评估在SQ亚型之间的肿瘤增殖的差异。
方法:使用TCGA肺癌基因表达数据集(鳞状细胞癌(SQ)n=501)1,在肺SQ亚型中评价差异性药物靶基因表达。如前所述的(最近质心预测)使用Clanc80SQ subtyper(参见实施例2和本文所述)来定义在SQ中的亚型。3检查SQ亚型,即原发型、经典型、分泌型、基底型。根据SQ亚型检查来自临床肿瘤学实体瘤突变小组(322种基因)4的基因的可变表达。使用具有Bonferroni校正的Kruskal-Wallis(KW)检验评估差异性基因表达。此外,增殖得分计算为11种基因PAM50增殖标签5中可获得基因的平均表达(log2(RSEM+1))。使用Kruskal-Wallis检验来测试亚型-增殖的关联。
结果:与图32相似,图25显示观察到SQ亚型之间的227种/322种(70%)的可变表达(KW Bonferroni阈值p<0.000155)。此外,就像实施例4中的图23中一样,存在显著的SQ亚型增殖差异(参见图26)。此外,从表11中所见的来自临床肿瘤学实体瘤突变小组的322种基因中的前25种基因在SQ亚型之间显示出差异性基因表达与表10中发现的非常相似。
结论:就像实施例4中一样,肺SQ的分子亚型在临床实体瘤测序小组中包括的大多数关键药物靶基因的表达方面不同。肺SQ的分子亚型揭示了宿主免疫应答和免疫靶标的差异性表达。
通过引用并入
出于所有目的,以下参考文献通过引用以其整体并入。
1.)TCGA Lung SQCC.Nature 2012;489(7417):519-525.PMID 22960745
2.)Wilkerson MD,et al.Clin Cancer Res 2010;16(19):4864-75.PMID20643781
3.)Foundation Medicine Solid Tumor Mutation Panel accessed October 6,2014.
4.)Neilson TO,Parker JS,Leung S,et al.Clin Cancer Res 2010;16(21):5222-5232.PMID 20837693
Figure GDA0002040024300000971
Figure GDA0002040024300000981
Figure GDA0002040024300000991
Figure GDA0002040024300001001
Figure GDA0002040024300001002
表10.如实施例4中所确定的SQ表达亚型的322肿瘤小组3的前25种分化基因。
Figure GDA0002040024300001003
Figure GDA0002040024300001011
表11.如实施例5中所确定的SQ表达亚型的322肿瘤小组3的前25种分化基因。
Figure GDA0002040024300001012
Figure GDA0002040024300001021
上述不同的实施方案可以组合以提供另外的实施方案。将在本说明书中引用的和/或在申请数据表中列举的所有美国专利申请公开案、美国专利申请、外国专利、外国专利申请和非专利公开案通过引用以其整体结合在此。如果必要的话,可以修改实施方案的方面,以采用不同专利、申请和公开案的概念以提供另外的实施方案。
根据上文详细说明,可以对实施方案作出这些和其他改变。总体上,在以下权利要求书中,所使用的术语不应解读为将权利要求书限制为说明书和权利要求书中公开的具体实施方案,而应解读为包括所有可能的实施方案连同这些权利要求所享有的等效权利的全部范围。因此,权利要求书不受本公开文本的限制。
序列表
<110> 基因中心治疗公司
北卡罗莱纳大学教堂山分校
Faruki, Hawazin
Lai-Goldman, Myla
Mayhew, Greg
Serody, Jonathan
Perou, Charles
Hayes, David Neil
<120> 对肺鳞状细胞癌亚型分型的方法
<130> GNCN-010/01WO 320289-2035
<150> US 62/425,717
<151> 2016-11-23
<150> US 62/420,836
<151> 2016-11-11
<150> US 62/396,587
<151> 2016-09-19
<150> US 62/337,645
<151> 2016-05-17
<150> US 62/379,402
<151> 2016-08-25
<160> 80
<170> PatentIn版本3.5
<210> 1
<211> 1787
<212> DNA
<213> 智人
<400> 1
aaccacagag ggaaaggcag caagaggaga ggcataaatt taggatctca cccttcattc 60
cacagacaca cacagcctct ctgcccacct ctgcttcctc taggaacaca ggagttccag 120
atcacatcga gttcaccatg aattcactca gtgaagccaa caccaagttc atgttcgatc 180
tgttccaaca gttcagaaaa tcaaaagaga acaacatctt ctattcccct atcagcatca 240
catcagcatt agggatggtc ctcttaggag ccaaagacaa cactgcacaa caaattagca 300
aggttcttca ctttgatcaa gtcacagaga acaccacaga aaaagctgca acatatcatg 360
ttgataggtc aggaaatgtt catcaccagt ttcaaaagct tctgactgaa ttcaacaaat 420
ccactgatgc atatgagctg aagatcgcca acaagctctt cggagaaaag acgtatcaat 480
ttttacagga atatttagat gccatcaaga aattttacca gaccagtgtg gaatctactg 540
attttgcaaa tgctccagaa gaaagtcgaa agaagattaa ctcctgggtg gaaagtcaaa 600
cgaatgaaaa aattaaaaac ctatttcctg atgggactat tggcaatgat acgacactgg 660
ttcttgtgaa cgcaatctat ttcaaagggc agtgggagaa taaatttaaa aaagaaaaca 720
ctaaagagga aaaattttgg ccaaacaaga atacatacaa atctgtacag atgatgaggc 780
aatacaattc ctttaatttt gccttgctgg aggatgtaca ggccaaggtc ctggaaatac 840
catacaaagg caaagatcta agcatgattg tgctgctgcc aaatgaaatc gatggtctgc 900
agaagcttga agagaaactc actgctgaga aattgatgga atggacaagt ttgcagaata 960
tgagagagac atgtgtcgat ttacacttac ctcggttcaa aatggaagag agctatgacc 1020
tcaaggacac gttgagaacc atgggaatgg tgaatatctt caatggggat gcagacctct 1080
caggcatgac ctggagccac ggtctctcag tatctaaagt cctacacaag gcctttgtgg 1140
aggtcactga ggagggagtg gaagctgcag ctgccaccgc tgtagtagta gtcgaattat 1200
catctccttc aactaatgaa gagttctgtt gtaatcaccc tttcctattc ttcataaggc 1260
aaaataagac caacagcatc ctcttctatg gcagattctc atccccatag atgcaattag 1320
tctgtcactc catttagaaa atgttcacct agaggtgttc tggtaaactg attgctggca 1380
acaacagatt ctcttggctc atatttcttt tctatctcat cttgatgatg atagtcatca 1440
tcaagaattt aatgattaaa atagcatgcc tttctctctt tctcttaata agcccacata 1500
taaatgtact tttccttcca gaaaaatttc ccttgaggaa aaatgtccaa gataagatga 1560
atcatttaat accgtgtctt ctaaatttga aatataattc tgtttctgac ctgttttaaa 1620
tgaaccaaac caaatcatac tttctcttca aatttagcaa cctagaaaca cacatttctt 1680
tgaatttagg tgatacctaa atccttctta tgtttctaaa ttttgtgatt ctataaaaca 1740
catcatcaat aaaataatga cataaaatca aaaaaaaaaa aaaaaaa 1787
<210> 2
<211> 1184
<212> DNA
<213> 智人
<400> 2
cacagagccc gggccgcagg cacctcctcg ccagctcttc cgctcctctc acagccgcca 60
gacccgcctg ctgagcccca tggcccgcgc tgctctctcc gccgccccca gcaatccccg 120
gctcctgcga gtggcactgc tgctcctgct cctggtagcc gctggccggc gcgcagcagg 180
agcgtccgtg gccactgaac tgcgctgcca gtgcttgcag accctgcagg gaattcaccc 240
caagaacatc caaagtgtga acgtgaagtc ccccggaccc cactgcgccc aaaccgaagt 300
catagccaca ctcaagaatg ggcggaaagc ttgcctcaat cctgcatccc ccatagttaa 360
gaaaatcatc gaaaagatgc tgaacagtga caaatccaac tgaccagaag ggaggaggaa 420
gctcactggt ggctgttcct gaaggaggcc ctgcccttat aggaacagaa gaggaaagag 480
agacacagct gcagaggcca cctggattgt gcctaatgtg tttgagcatc gcttaggaga 540
agtcttctat ttatttattt attcattagt tttgaagatt ctatgttaat attttaggtg 600
taaaataatt aagggtatga ttaactctac ctgcacactg tcctattata ttcattcttt 660
ttgaaatgtc aaccccaagt tagttcaatc tggattcata tttaatttga aggtagaatg 720
ttttcaaatg ttctccagtc attatgttaa tatttctgag gagcctgcaa catgccagcc 780
actgtgatag aggctggcgg atccaagcaa atggccaatg agatcattgt gaaggcaggg 840
gaatgtatgt gcacatctgt tttgtaactg tttagatgaa tgtcagttgt tatttattga 900
aatgatttca cagtgtgtgg tcaacatttc tcatgttgaa actttaagaa ctaaaatgtt 960
ctaaatatcc cttggacatt ttatgtcttt cttgtaaggc atactgcctt gtttaatggt 1020
agttttacag tgtttctggc ttagaacaaa ggggcttaat tattgatgtt ttcatagaga 1080
atataaaaat aaagcactta tagaaaaaac tcgtttgatt tttgggggga aacaagggct 1140
acctttactg gaaaatctgg tgatttataa aaaaaaaaaa aaaa 1184
<210> 3
<211> 586
<212> DNA
<213> 智人
<400> 3
aaacactctg tgtggctcct cggctttgac agagtgcaag acgatgactt gcaaaatgtc 60
gcagctggaa cgcaacatag agaccatcat caacaccttc caccaatact ctgtgaagct 120
ggggcaccca gacaccctga accaggggga attcaaagag ctggtgcgaa aagatctgca 180
aaattttctc aagaaggaga ataagaatga aaaggtcata gaacacatca tggaggacct 240
ggacacaaat gcagacaagc agctgagctt cgaggagttc atcatgctga tggcgaggct 300
aacctgggcc tcccacgaga agatgcacga gggtgacgag ggccctggcc accaccataa 360
gccaggcctc ggggagggca ccccctaaga ccacagtggc caagatcaca gtggccacgg 420
ccacggccac agtcatggtg gccacggcca cagccactaa tcaggaggcc aggccaccct 480
gcctctaccc aaccagggcc ccggggcctg ttatgtcaaa ctgtcttggc tgtggggcta 540
ggggctgggg ccaaataaag tctcttcctc caagtcaaaa aaaaaa 586
<210> 4
<211> 549
<212> DNA
<213> 智人
<400> 4
gagaaaccag agactgtagc aactctggca gggagaagct gtctctgatg gcctgaagct 60
gtgggcagct ggccaagcct aaccgctata aaaaggagct gcctctcagc cctgcatgtc 120
tcttgtcagc tgtctttcag aagacctgaa ggttctgttt ttcaggtggg gcaagtccgt 180
gggcatcatg ttgaccgagc tggagaaagc cttgaactct atcatcgacg tctaccacaa 240
gtactccctg ataaagggga atttccatgc cgtctacagg gatgacctga agaaattgct 300
agagaccgag tgtcctcagt atatcaggaa aaagggtgca gacgtctggt tcaaagagtt 360
ggatatcaac actgatggtg cagttaactt ccaggagttc ctcattctgg tgataaagat 420
gggcgtggca gcccacaaaa aaagccatga agaaagccac aaagagtagc tgagttactg 480
ggcccagagg ctgggcccct ggacatgtac ctgcagaata ataaagtcat caatacctca 540
aaaaaaaaa 549
<210> 5
<211> 1793
<212> DNA
<213> 智人
<400> 5
aaatactaac cacagaggga gaggcagcaa gaggagaggc ataaattcag gatctcaccc 60
ttcattccac agacacacat agcctctctg cccacctctg cttcctctag gaacacagga 120
gttccagatc acatcgagtt caccatgaat tcactcagtg aagccaacac caagttcatg 180
ttcgacctgt tccaacagtt cagaaaatca aaagagaaca acatcttcta ttcccctatc 240
agcatcacat cagcattagg gatggtcctc ttaggagcca aagacaacac tgcacaacag 300
attaagaagg ttcttcactt tgatcaagtc acagagaaca ccacaggaaa agctgcaaca 360
tatcatgttg ataggtcagg aaatgttcat caccagtttc aaaagcttct gactgaattc 420
aacaaatcca ctgatgcata tgagctgaag atcgccaaca agctcttcgg agaaaaaacg 480
tatctatttt tacaggaata tttagatgcc atcaagaaat tttaccagac cagtgtggaa 540
tctgttgatt ttgcaaatgc tccagaagaa agtcgaaaga agattaactc ctgggtggaa 600
agtcaaacga atgaaaaaat taaaaaccta attcctgaag gtaatattgg cagcaatacc 660
acattggttc ttgtgaacgc aatctatttc aaagggcagt gggagaagaa atttaataaa 720
gaagatacta aagaggaaaa attttggcca aacaagaata catacaagtc catacagatg 780
atgaggcaat acacatcttt tcattttgcc tcgctggagg atgtacaggc caaggtcctg 840
gaaataccat acaaaggcaa agatctaagc atgattgtgt tgctgccaaa tgaaatcgat 900
ggtctccaga agcttgaaga gaaactcact gctgagaaat tgatggaatg gacaagtttg 960
cagaatatga gagagacacg tgtcgattta cacttacctc ggttcaaagt ggaagagagc 1020
tatgacctca aggacacgtt gagaaccatg ggaatggtgg atatcttcaa tggggatgca 1080
gacctctcag gcatgaccgg gagccgcggt ctcgtgctat ctggagtcct acacaaggcc 1140
tttgtggagg ttacagagga gggagcagaa gctgcagctg ccaccgctgt agtaggattc 1200
ggatcatcac ctacttcaac taatgaagag ttccattgta atcacccttt cctattcttc 1260
ataaggcaaa ataagaccaa cagcatcctc ttctatggca gattctcatc cccgtagatg 1320
caattagtct gtcactccat ttggaaaatg ttcacctgca gatgttctgg taaactgatt 1380
gctggcaaca acagattctc ttggctcata tttcttttct ttctcatctt gatgatgatc 1440
gtcatcatca agaatttaat gattaaaata gcatgccttt ctctctttct cttaataagc 1500
ccacatataa atgtactttt tcttccagaa aaattctcct tgaggaaaaa tgtccaaaat 1560
aagatgaatc acttaatacc gtatcttcta aatttgaaat ataattctgt ttgtgacctg 1620
ttttaaatga accaaaccaa atcatacttt ttctttgaat ttagcaacct agaaacacac 1680
atttctttga atttaggtga tacctaaatc cttcttatgt ttctaaattt tgtgattcta 1740
taaaacacat catcaataaa atagtgacat aaaatcaaaa aaaaaaaaaa aaa 1793
<210> 6
<211> 3992
<212> DNA
<213> 智人
<400> 6
agggcatgaa tgaacaggag tcggttctca cccaacttcc attaaggact cggggcagga 60
ggggcagaag ttgcgcgcag gccggcgggc gggagcggac accgaggccg gcgtgcaggc 120
gtgcgggtgt gcgggagccg ggctcggggg gatcggaccg agagcgagaa gcgcggcatg 180
gagctccagg cagcccgcgc ctgcttcgcc ctgctgtggg gctgtgcgct ggccgcggcc 240
gcggcggcgc agggcaagga agtggtactg ctggactttg ctgcagctgg aggggagctc 300
ggctggctca cacacccgta tggcaaaggg tgggacctga tgcagaacat catgaatgac 360
atgccgatct acatgtactc cgtgtgcaac gtgatgtctg gcgaccagga caactggctc 420
cgcaccaact gggtgtaccg aggagaggct gagcgtatct tcattgagct caagtttact 480
gtacgtgact gcaacagctt ccctggtggc gccagctcct gcaaggagac tttcaacctc 540
tactatgccg agtcggacct ggactacggc accaacttcc agaagcgcct gttcaccaag 600
attgacacca ttgcgcccga tgagatcacc gtcagcagcg acttcgaggc acgccacgtg 660
aagctgaacg tggaggagcg ctccgtgggg ccgctcaccc gcaaaggctt ctacctggcc 720
ttccaggata tcggtgcctg tgtggcgctg ctctccgtcc gtgtctacta caagaagtgc 780
cccgagctgc tgcagggcct ggcccacttc cctgagacca tcgccggctc tgatgcacct 840
tccctggcca ctgtggccgg cacctgtgtg gaccatgccg tggtgccacc ggggggtgaa 900
gagccccgta tgcactgtgc agtggatggc gagtggctgg tgcccattgg gcagtgcctg 960
tgccaggcag gctacgagaa ggtggaggat gcctgccagg cctgctcgcc tggatttttt 1020
aagtttgagg catctgagag cccctgcttg gagtgccctg agcacacgct gccatcccct 1080
gagggtgcca cctcctgcga gtgtgaggaa ggcttcttcc gggcacctca ggacccagcg 1140
tcgatgcctt gcacacgacc cccctccgcc ccacactacc tcacagccgt gggcatgggt 1200
gccaaggtgg agctgcgctg gacgccccct caggacagcg ggggccgcga ggacattgtc 1260
tacagcgtca cctgcgaaca gtgctggccc gagtctgggg aatgcgggcc gtgtgaggcc 1320
agtgtgcgct actcggagcc tcctcacgga ctgacccgca ccagtgtgac agtgagcgac 1380
ctggagcccc acatgaacta caccttcacc gtggaggccc gcaatggcgt ctcaggcctg 1440
gtaaccagcc gcagcttccg tactgccagt gtcagcatca accagacaga gccccccaag 1500
gtgaggctgg agggccgcag caccacctcg cttagcgtct cctggagcat ccccccgccg 1560
cagcagagcc gagtgtggaa gtacgaggtc acttaccgca agaagggaga ctccaacagc 1620
tacaatgtgc gccgcaccga gggtttctcc gtgaccctgg acgacctggc cccagacacc 1680
acctacctgg tccaggtgca ggcactgacg caggagggcc agggggccgg cagcaaggtg 1740
cacgaattcc agacgctgtc cccggaggga tctggcaact tggcggtgat tggcggcgtg 1800
gctgtcggtg tggtcctgct tctggtgctg gcaggagttg gcttctttat ccaccgcagg 1860
aggaagaacc agcgtgcccg ccagtccccg gaggacgttt acttctccaa gtcagaacaa 1920
ctgaagcccc tgaagacata cgtggacccc cacacatatg aggaccccaa ccaggctgtg 1980
ttgaagttca ctaccgagat ccatccatcc tgtgtcactc ggcagaaggt gatcggagca 2040
ggagagtttg gggaggtgta caagggcatg ctgaagacat cctcggggaa gaaggaggtg 2100
ccggtggcca tcaagacgct gaaagccggc tacacagaga agcagcgagt ggacttcctc 2160
ggcgaggccg gcatcatggg ccagttcagc caccacaaca tcatccgcct agagggcgtc 2220
atctccaaat acaagcccat gatgatcatc actgagtaca tggagaatgg ggccctggac 2280
aagttccttc gggagaagga tggcgagttc agcgtgctgc agctggtggg catgctgcgg 2340
ggcatcgcag ctggcatgaa gtacctggcc aacatgaact atgtgcaccg tgacctggct 2400
gcccgcaaca tcctcgtcaa cagcaacctg gtctgcaagg tgtctgactt tggcctgtcc 2460
cgcgtgctgg aggacgaccc cgaggccacc tacaccacca gtggcggcaa gatccccatc 2520
cgctggaccg ccccggaggc catttcctac cggaagttca cctctgccag cgacgtgtgg 2580
agctttggca ttgtcatgtg ggaggtgatg acctatggcg agcggcccta ctgggagttg 2640
tccaaccacg aggtgatgaa agccatcaat gatggcttcc ggctccccac acccatggac 2700
tgcccctccg ccatctacca gctcatgatg cagtgctggc agcaggagcg tgcccgccgc 2760
cccaagttcg ctgacatcgt cagcatcctg gacaagctca ttcgtgcccc tgactccctc 2820
aagaccctgg ctgactttga cccccgcgtg tctatccggc tccccagcac gagcggctcg 2880
gagggggtgc ccttccgcac ggtgtccgag tggctggagt ccatcaagat gcagcagtat 2940
acggagcact tcatggcggc cggctacact gccatcgaga aggtggtgca gatgaccaac 3000
gacgacatca agaggattgg ggtgcggctg cccggccacc agaagcgcat cgcctacagc 3060
ctgctgggac tcaaggacca ggtgaacact gtggggatcc ccatctgagc ctcgacaggg 3120
cctggagccc catcggccaa gaatacttga agaaacagag tggcctccct gctgtgccat 3180
gctgggccac tggggacttt atttatttct agttctttcc tccccctgca acttccgctg 3240
aggggtctcg gatgacaccc tggcctgaac tgaggagatg accagggatg ctgggctggg 3300
ccctctttcc ctgcgagacg cacacagctg agcacttagc aggcaccgcc acgtcccagc 3360
atccctggag caggagcccc gccacagcct tcggacagac atatgggata ttcccaagcc 3420
gaccttccct ccgccttctc ccacatgagg ccatctcagg agatggaggg cttggcccag 3480
cgccaagtaa acagggtacc tcaagcccca tttcctcaca ctaagagggc agactgtgaa 3540
cttgactggg tgagacccaa agcggtccct gtccctctag tgccttcttt agaccctcgg 3600
gccccatcct catccctgac tggccaaacc cttgctttcc tgggcctttg caagatgctt 3660
ggttgtgttg aggtttttaa atatatattt tgtactttgt ggagagaatg tgtgtgtgtg 3720
gcagggggcc ccgccagggc tggggacaga gggtgtcaaa cattcgtgag ctggggactc 3780
agggaccggt gctgcaggag tgtcctgccc atgccccagt cggccccatc tctcatcctt 3840
ttggataagt ttctattctg tcagtgttaa agattttgtt ttgttggaca tttttttcga 3900
atcttaattt attatttttt ttatatttat tgttagaaaa tgacttattt ctgctctgga 3960
ataaagttgc agatgattca aaccgaaaaa aa 3992
<210> 7
<211> 970
<212> DNA
<213> 智人
<400> 7
ctcccctcac cccggtccag gatgcccagt ccccacgaca cctcccactt cccactgtgg 60
cctgggtggg ctcaggggct gcccttgacc tggcctagag ccctccccca gctggtggtg 120
gagctggcac tctctgggag ggagggggct gggagggaat gagtgggaat ggcaagaggc 180
cagggtttgg tgggatcagg ttgaggcagg tttggtttcc ttaaaatgcc aagttggggg 240
ccagtggggc ccacatataa atcctcaccc tgggagcctg gctgccttgc tctccttcct 300
gggtctgtct ctgccacctg gtctgccaca gatccatgat gtgcagttct ctggagcagg 360
cgctggctgt gctggtcact accttccaca agtactcctg ccaagagggc gacaagttca 420
agctgagtaa gggggaaatg aaggaacttc tgcacaagga gctgcccagc tttgtggggg 480
agaaagtgga tgaggagggg ctgaagaagc tgatgggcag cctggatgag aacagtgacc 540
agcaggtgga cttccaggag tatgctgttt tcctggcact catcactgtc atgtgcaatg 600
acttcttcca gggctgccca gaccgaccct gaagcagaac tcttgacttc ctgccatgga 660
tctcttgggc ccaggactgt tgatgccttt gagttttgta ttcaataaac tttttttgtc 720
tgttgataat attttaattg ctcagtgatg ttccataacc cggctggctc agctggagtg 780
ctgggagatg agggcctcct ggatcctgct cccttctggg ctctgactct cctggaaatc 840
tctccaaggc cagagctatg ctttaggtct caattttgga atttcaaaca ccagcaaaaa 900
attggaaatc gagataggtt gctgactttt attttgtcaa ataaagatat taaaaaaggc 960
aaaaaaaaaa 970
<210> 8
<211> 1777
<212> DNA
<213> 智人
<400> 8
agaagcccag tagacaaaga aggtaagggc agtgagaatg atgcatcttg cattccttgt 60
gctgttgtgt ctgccagtct gctctgccta tcctctgagt ggggcagcaa aagaggagga 120
ctccaacaag gatcttgccc agcaatacct agaaaagtac tacaacctcg aaaaggatgt 180
gaaacagttt agaagaaagg acagtaatct cattgttaaa aaaatccaag gaatgcagaa 240
gttccttggg ttggaggtga cagggaagct agacactgac actctggagg tgatgcgcaa 300
gcccaggtgt ggagttcctg acgttggtca cttcagctcc tttcctggca tgccgaagtg 360
gaggaaaacc caccttacat acaggattgt gaattataca ccagatttgc caagagatgc 420
tgttgattct gccattgaga aagctctgaa agtctgggaa gaggtgactc cactcacatt 480
ctccaggctg tatgaaggag aggctgatat aatgatctct tttgcagtta aagaacatgg 540
agacttttac tcttttgatg gcccaggaca cagtttggct catgcctacc cacctggacc 600
tgggctttat ggagatattc actttgatga tgatgaaaaa tggacagaag atgcatcagg 660
caccaattta ttcctcgttg ctgctcatga acttggccac tccctggggc tctttcactc 720
agccaacact gaagctttga tgtacccact ctacaactca ttcacagagc tcgcccagtt 780
ccgcctttcg caagatgatg tgaatggcat tcagtctctc tacggacctc cccctgcctc 840
tactgaggaa cccctggtgc ccacaaaatc tgttccttcg ggatctgaga tgccagccaa 900
gtgtgatcct gctttgtcct tcgatgccat cagcactctg aggggagaat atctgttctt 960
taaagacaga tatttttggc gaagatccca ctggaaccct gaacctgaat ttcatttgat 1020
ttctgcattt tggccctctc ttccatcata tttggatgct gcatatgaag ttaacagcag 1080
ggacaccgtt tttattttta aaggaaatga gttctgggcc atcagaggaa atgaggtaca 1140
agcaggttat ccaagaggca tccataccct gggttttcct ccaaccataa ggaaaattga 1200
tgcagctgtt tctgacaagg aaaagaagaa aacatacttc tttgcagcgg acaaatactg 1260
gagatttgat gaaaatagcc agtccatgga gcaaggcttc cctagactaa tagctgatga 1320
ctttccagga gttgagccta aggttgatgc tgtattacag gcatttggat ttttctactt 1380
cttcagtgga tcatcacagt ttgagtttga ccccaatgcc aggatggtga cacacatatt 1440
aaagagtaac agctggttac attgctaggc gagatagggg gaagacagat atgggtgttt 1500
ttaataaatc taataattat tcatctaatg tattatgagc caaaatggtt aatttttcct 1560
gcatgttctg tgactgaaga agatgagcct tgcagatatc tgcatgtgtc atgaagaatg 1620
tttctggaat tcttcacttg cttttgaatt gcactgaaca gaattaagaa atactcatgt 1680
gcaataggtg agagaatgta ttttcataga tgtgttatta cttcctcaat aaaaagtttt 1740
attttgggcc tgttccttaa aaaaaaaaaa aaaaaaa 1777
<210> 9
<211> 3710
<212> DNA
<213> 智人
<400> 9
gggtctccgc gcccaggaaa gccccgcgcg gcgcgggcca gggaagggcc acccaggggt 60
cccccacttc ccgcttgggc gcccggacgg cgaatggagc aggggcgcgc agataattaa 120
agatttacac acagctggaa gaaatcatag agaagccggg cgtggtggct catgcctata 180
atcccagcac ttttggaggc tgaggcgggc agatcacttg agatcaggag ttcgagacca 240
gcctggtgcc ttggcatctc ccaatggggt ggctttgctc tgggctcctg ttccctgtga 300
gctgcctggt cctgctgcag gtggcaagct ctgggaacat gaaggtcttg caggagccca 360
cctgcgtctc cgactacatg agcatctcta cttgcgagtg gaagatgaat ggtcccacca 420
attgcagcac cgagctccgc ctgttgtacc agctggtttt tctgctctcc gaagcccaca 480
cgtgtatccc tgagaacaac ggaggcgcgg ggtgcgtgtg ccacctgctc atggatgacg 540
tggtcagtgc ggataactat acactggacc tgtgggctgg gcagcagctg ctgtggaagg 600
gctccttcaa gcccagcgag catgtgaaac ccagggcccc aggaaacctg acagttcaca 660
ccaatgtctc cgacactctg ctgctgacct ggagcaaccc gtatccccct gacaattacc 720
tgtataatca tctcacctat gcagtcaaca tttggagtga aaacgacccg gcagatttca 780
gaatctataa cgtgacctac ctagaaccct ccctccgcat cgcagccagc accctgaagt 840
ctgggatttc ctacagggca cgggtgaggg cctgggctca gtgctataac accacctgga 900
gtgagtggag ccccagcacc aagtggcaca actcctacag ggagcccttc gagcagcacc 960
tcctgctggg cgtcagcgtt tcctgcattg tcatcctggc cgtctgcctg ttgtgctatg 1020
tcagcatcac caagattaag aaagaatggt gggatcagat tcccaaccca gcccgcagcc 1080
gcctcgtggc tataataatc caggatgctc aggggtcaca gtgggagaag cggtcccgag 1140
gccaggaacc agccaagtgc ccacactgga agaattgtct taccaagctc ttgccctgtt 1200
ttctggagca caacatgaaa agggatgaag atcctcacaa ggctgccaaa gagatgcctt 1260
tccagggctc tggaaaatca gcatggtgcc cagtggagat cagcaagaca gtcctctggc 1320
cagagagcat cagcgtggtg cgatgtgtgg agttgtttga ggccccggtg gagtgtgagg 1380
aggaggagga ggtagaggaa gaaaaaggga gcttctgtgc atcgcctgag agcagcaggg 1440
atgacttcca ggagggaagg gagggcattg tggcccggct aacagagagc ctgttcctgg 1500
acctgctcgg agaggagaat gggggctttt gccagcagga catgggggag tcatgccttc 1560
ttccaccttc gggaagtacg agtgctcaca tgccctggga tgagttccca agtgcagggc 1620
ccaaggaggc acctccctgg ggcaaggagc agcctctcca cctggagcca agtcctcctg 1680
ccagcccgac ccagagtcca gacaacctga cttgcacaga gacgcccctc gtcatcgcag 1740
gcaaccctgc ttaccgcagc ttcagcaact ccctgagcca gtcaccgtgt cccagagagc 1800
tgggtccaga cccactgctg gccagacacc tggaggaagt agaacccgag atgccctgtg 1860
tcccccagct ctctgagcca accactgtgc cccaacctga gccagaaacc tgggagcaga 1920
tcctccgccg aaatgtcctc cagcatgggg cagctgcagc ccccgtctcg gcccccacca 1980
gtggctatca ggagtttgta catgcggtgg agcagggtgg cacccaggcc agtgcggtgg 2040
tgggcttggg tcccccagga gaggctggtt acaaggcctt ctcaagcctg cttgccagca 2100
gtgctgtgtc cccagagaaa tgtgggtttg gggctagcag tggggaagag gggtataagc 2160
ctttccaaga cctcattcct ggctgccctg gggaccctgc cccagtccct gtccccttgt 2220
tcacctttgg actggacagg gagccacctc gcagtccgca gagctcacat ctcccaagca 2280
gctccccaga gcacctgggt ctggagccgg gggaaaaggt agaggacatg ccaaagcccc 2340
cacttcccca ggagcaggcc acagaccccc ttgtggacag cctgggcagt ggcattgtct 2400
actcagccct tacctgccac ctgtgcggcc acctgaaaca gtgtcatggc caggaggatg 2460
gtggccagac ccctgtcatg gccagtcctt gctgtggctg ctgctgtgga gacaggtcct 2520
cgccccctac aacccccctg agggccccag acccctctcc aggtggggtt ccactggagg 2580
ccagtctgtg tccggcctcc ctggcaccct cgggcatctc agagaagagt aaatcctcat 2640
catccttcca tcctgcccct ggcaatgctc agagctcaag ccagaccccc aaaatcgtga 2700
actttgtctc cgtgggaccc acatacatga gggtctctta ggtgcatgtc ctcttgttgc 2760
tgagtctgca gatgaggact agggcttatc catgcctggg aaatgccacc tcctggaagg 2820
cagccaggct ggcagatttc caaaagactt gaagaaccat ggtatgaagg tgattggccc 2880
cactgacgtt ggcctaacac tgggctgcag agactggacc ccgcccagca ttgggctggg 2940
ctcgccacat cccatgagag tagagggcac tgggtcgccg tgccccacgg caggcccctg 3000
caggaaaact gaggcccttg ggcacctcga cttgtgaacg agttgttggc tgctccctcc 3060
acagcttctg cagcagactg tccctgttgt aactgcccaa ggcatgtttt gcccaccaga 3120
tcatggccca cgtggaggcc cacctgcctc tgtctcactg aactagaagc cgagcctaga 3180
aactaacaca gccatcaagg gaatgacttg ggcggccttg ggaaatcgat gagaaattga 3240
acttcaggga gggtggtcat tgcctagagg tgctcattca tttaacagag cttccttagg 3300
ttgatgctgg aggcagaatc ccggctgtca aggggtgttc agttaagggg agcaacagag 3360
gacatgaaaa attgctatga ctaaagcagg gacaatttgc tgccaaacac ccatgcccag 3420
ctgtatggct gggggctcct cgtatgcatg gaacccccag aataaatatg ctcagccacc 3480
ctgtgggccg ggcaatccag acagcaggca taaggcacca gttaccctgc atgttggccc 3540
agacctcagg tgctagggaa ggcgggaacc ttgggttgag taatgctcgt ctgtgtgttt 3600
tagtttcatc acctgttatc tgtgtttgct gaggagagtg gaacagaagg ggtggagttt 3660
tgtataaata aagtttcttt gtctctttaa aaaaaaaaaa aaaaaaaaaa 3710
<210> 10
<211> 894
<212> DNA
<213> 智人
<400> 10
gcccgtcttc gtgtctcctc cctccctcgc cttcctcctt cctagctcct ctcctccagg 60
gccagactga gcccaggttg atttcaggcg gacaccaata gactccacag cagctccagg 120
agcccagaca ccggcggcca gaagcaaggc taggagctgc tgcagccatg tcggccctca 180
gcctcctcat tctgggcctg ctcacggcag tgccacctgc cagctgtcag caaggcctgg 240
ggaaccttca gccctggatg cagggcctta tcgcggtggc cgtgttcctg gtcctcgttg 300
caatcgcctt tgcagtcaac cacttctggt gccaggagga gccggagcct gcacacatga 360
tcctgaccgt cggaaacaag gcagatggag tcctggtggg aacagatgga aggtactctt 420
cgatggcggc cagtttcagg tccagtgagc atgagaatgc ctatgagaat gtgcccgagg 480
aggaaggcaa ggtccgcagc accccgatgt aaccttctct gtggctccaa ccccaagact 540
cccaggcaca tgggatggat gtccagtgct accacccaag ccccctcctt ctttgtgtgg 600
aatctgcaat agtgggctga ctccctccag ccccatgccg gccctacccg cccttgaagt 660
atagccagcc aaggttggag ctcagaccgt gtctaggttg gggctcggct gtggccctgg 720
ggtctcctgc tcagctcaga agagccttct ggagaggaca gtcagctgag cacctcccat 780
cctgctcaca cgtccttccc cataactatg gaaatggccc taatttctgt gaaataaaga 840
ctttttgtat ttctggggct gaggctcagc aacagcccct caggcttcca gtga 894
<210> 11
<211> 6242
<212> DNA
<213> 智人
<400> 11
ctcgtttccg taggaagaag cgccgggaaa gatggcggcg tctgtggttt gaattccagc 60
ggcgccgcca gagtctgaac aagagctggg gtggaggggg cggggacctg gggagcccgg 120
cgggtcgcta tcgcgggggg tactagtggc gccgccgcca cagacaccaa cgctgtcgcc 180
acctctgtag ccatgatgga cttggtgttg gaagaggacg tcaccgtccc tgggacgctc 240
agcggctgca gtggccttgt tcccagtgta ccagatgacc tggatggcat caaccccaat 300
gctgggttgg gaaatggtct gctcccaaat gtgtcagaag aaacagtgtc tcccaccaga 360
gcacggaaca tgaaggactt tgaaaatcaa atcactgaat tgaagaaaga aaactttaac 420
ctaaagctcc gcatctattt ccttgaggaa agaatgcaac aggaatttca tggccccact 480
gaacatatct acaaaactaa cattgagctc aaggtggaag tagaaagtct gaagcgggaa 540
ctccaggaga gagagcagct gctcatcaaa gcctccaaag cagttgagag cttagctgaa 600
gcaggtggct ctgaaatcca gcgggtgaaa gaagatgctc gaaagaaggt gcagcaggtg 660
gaagatctcc taactaaaag aatactcctt ttggaaaagg atgtgacagc cgcccaggca 720
gaactggaaa aggcctttgc agggacagag acggagaagg ctcttcggtt gcgtttggaa 780
agcaagcttt cagagatgaa gaagatgcac gagggggact tggcgatggc tctggtcctg 840
gatgagaaag acagactgat tgaggagttg aagctgtctt tgaagagcaa agaagcttta 900
attcagtgcc ttaaagagga gaaatctcag atggcatgtc ctgatgagaa tgtgtcatct 960
ggagagctcc gaggactttg tgctgctcca agggaagaaa aggagagaga aactgaggct 1020
gcacaaatgg agcatcagaa ggagagaaac agctttgaag agaggatcca ggcacttgaa 1080
gaggacctga gagagaagga aagagaaatt gctacagaga agaaaaatag tctaaagagg 1140
gataaagcca ttcagggttt aaccatggca ttaaaatcaa aggaaaaaaa ggttgaagaa 1200
cttaactctg aaattgaaaa gctcagtgct gcctttgcta aagccagaga ggccctacag 1260
aaagcacaga cccaggaatt tcaggggtct gaagactatg agactgctct atcaggaaag 1320
gaagcccttt cggctgcgct gcgctcacaa aacctcacca agagtacaga gaaccacaga 1380
ctgcgtagaa gcattaagaa gatcacccag gagctgagtg acttgcagca ggagagggag 1440
agactggaga aggacctgga ggaagcccat cgagagaaga gcaaaggaga ctgcaccatc 1500
cgtgatctta gaaatgaagt tgaaaaatta cgcaatgaag tgaatgaaag agagaaagca 1560
atggaaaatc gttacaagag tcttctgagt gaaagcaata aaaaattgca caatcaagag 1620
caagtgatca aacatctaac agaaagtacc aatcagaagg acgtgttgct tcagaaattc 1680
aatgaaaaag atttggaagt aatacagcag aactgctatt taatggctgc agaggatctt 1740
gagctcagga gtgaaggctt aataacagaa aagtgctctt ctcaacagcc accaggcagc 1800
aaaaccatct tctctaagga aaagaaacaa tcatcagact atgaagagct gattcaggtc 1860
ttaaagaaag agcaggacat ctatacccat ctggtcaaat ctctgcagga atcagacagt 1920
atcaacaacc tgcaggctga gttaaacaag atttttgccc tgcggaagca actggagcag 1980
gatgtgcttt catatcagaa tttgcggaag accttggagg agcagatcag cgaaattcgg 2040
aggcgggaag aagaatcatt ttcactttat agtgatcaaa catcttatct aagtatttgc 2100
cttgaagaaa acaatcggtt tcaagtggaa catttttctc aagaagaact taagaaaaag 2160
gtcagtgacc ttatacagct agtgaaggag ctgtatacag acaaccagca cctgaagaaa 2220
accatttttg atctctcctg catgggtttc cagggaaatg ggtttccaga tagacttgcg 2280
tctacagaac aaacagagct tctggctagc aaggaggacg aggacacgat caaaattggg 2340
gaggatgacg agattaattt cctgagtgac cagcatttgc agcagagtaa tgagattatg 2400
aaagaccttt ccaaaggagg ctgcaaaaat ggatacttaa ggcacacgga gtctaagatt 2460
tcagattgtg atggggccca cgcacctggc tgcctagaag aaggtgcatt cataaacctg 2520
cttgcccctt tgttcaatga gaaggccaca ttattactgg aatccaggcc agaccttctg 2580
aaagtggtac gggaactgct tctgggacaa ctattcttga cagagcagga agtttctgga 2640
gaacaccttg atggtaaaac tgagaagaca cctaagcaaa aaggtgaact tgtacatttt 2700
gtccaaacca actcattttc caagccacat gatgaactga agttgtcttg tgaggcccag 2760
ctagtaaagg caggcgaagt gcccaaggta ggactgaaag atgcctcagt gcagactgtg 2820
gccacggagg gcgacctgct gagattcaag catgaagcaa caagagaggc ttgggaagag 2880
aaaccgatca acactgcact cagcgcagag catcggccag agaacctgca cggggtgcct 2940
gggtggcagg ctgccctcct ttccctccct ggtattacca acagagaggc taagaagtcc 3000
cgcttgccaa tcctaataaa accatcccgg tcattaggaa atatgtatcg tctccctgcc 3060
acccaggagg tggtgacgca gctgcagagc cagatcttgg agctgcaggg ggagctgaag 3120
gagtttaaaa cttgtaataa gcaacttcac caaaagttaa ttctggctga agcagtgatg 3180
gaggggaggc caacgcccga caaaacgttg ctgaatgctc agccccctgt gggagcagcc 3240
taccaggaca gcccaggaga gcagaaagga attaaaacca catcttctgt ctggagagac 3300
aaggaaatgg acagtgatca gcaaagaagc tacgagattg actctgagat ttgcccacct 3360
gatgaccttg ccagcttgcc atcatgcaaa gaaaatcctg aagatgttct gagcccaact 3420
tcagtagcta cttacctgag ttccaagagt cagccttctg ctaaagtcag tgtgatgggg 3480
actgatcagt cagagagcat taatacctca aatgagacag aatacttaaa acagaaaatc 3540
catgacttgg aaactgagct ggaaggctac cagaatttca tatttcagct tcaaaagcac 3600
tcccagtgca gtgaggccat aattacagtt ttgtgtggga cagaaggggc ccaggatggc 3660
ttgagcaagc ccaagaatgg ttctgatggg gaagaaatga ccttttcaag tttgcaccaa 3720
gtgcgatacg tgaaacacgt gaaaatcctc ggtccgctgg ccccagagat gattgacagc 3780
agggtgctgg agaacctcaa acagcagctg gaggaacagg aatacaagct gcagaaggag 3840
cagaatttga acatgcaact tttcagtgag atccataatc tgcagaataa gttcagagat 3900
ctctcacctc ccagatacga ttcattagtt cagtcccaag ccagggagct ctcccttcaa 3960
cggcagcaga ttaaggatgg ccatggcatc tgtgtcatct cccgtcaaca catgaacacc 4020
atgattaagg catttgagga gttgctgcag gccagtgatg tggattactg tgtggccgag 4080
ggtttccagg aacagctgaa tcaatgtgct gagctgctgg agaaattgga aaagctattt 4140
ctcaacggaa aatcagttgg agtggaaatg aacacccaga atgaactgat ggagaggatt 4200
gaggaagaca acttaaccta ccaacatctt ctgcctgaat ctcctgagcc ttcagcctct 4260
catgcgctct ctgattatga aacatctgaa aagtccttct tctcacgaga ccagaagcaa 4320
gataatgaga cagagaagac ttcagttatg gtgaacagtt tttctcaaga cttactaatg 4380
gaacacatac aggaaattcg aactttgaga aagcgtttag aagaatctat taaaacaaat 4440
gagaagctac ggaaacagtt ggaacggcaa ggatctgaat ttgttcaagg ttctacaagc 4500
atttttgctt ctggttcaga gcttcatagt tctctaacat cagaaattca tttcttgagg 4560
aagcagaacc aggccctcaa tgcaatgctc attaaaggat ccagagataa acagaaggag 4620
aatgacaaat tacgagagtc cctctccagg aagaccgtga gcctggagca ccttcagcgg 4680
gagtatgcca gcgtgaagga agaaaatgaa aggctgcaga aagaaggcag cgagaaggag 4740
agacacaacc agcagctgat ccaggaggtc cgctgcagcg gccaggagct gagcagggtg 4800
caggaggagg tgaagttgag gcagcagctg ctctcacaga atgacaagct attgcagtct 4860
ctccgagtgg agctgaaggc gtatgagaag ctggatgaag agcacaggag actgagagag 4920
gcgtcgggag aaggctggaa ggggcaggat cctttcaggg acctgcacag cctcctgatg 4980
gagatccagg ctctgcgctt gcaactagaa aggagcatcg aaaccagcag cactctgcag 5040
agcaggctca aggaacagct ggcaaggggg gcagagaagg cacaggaagg agccctcact 5100
ctggctgtcc aagccgtgtc catccctgag gtgccccttc agcctgacaa acacgatggt 5160
gacaaatatc ccatggaaag tgataattca tttgatctgt ttgattcctc ccaggcagtg 5220
acaccaaaat cagtttcaga gactcctcca ctctctggga atgacacgga ctccctctcc 5280
tgcgacagtg gcagttcggc aactagcact ccgtgtgtgt cccgcctggt cactggccac 5340
cacctgtggg ccagcaagaa tggccgccat gtcctgggcc tgattgagga ctatgaggcc 5400
ctgctcaaac agatcagcca gggacagagg ctccttgctg aaatggacat tcaaacccaa 5460
gaggctccca gctccacaag tcaagagctg ggaacaaagg gtccacaccc agcaccactg 5520
agcaagtttg tgagcagtgt gagcacggcc aagctgaccc tggaagaggc ctacaggcgg 5580
ctgaagcttc tctggagagt ctcactcccc gaggatggcc agtgccccct tcactgtgag 5640
cagattggag aaatgaaggc agaggtcacc aaactacata aaaaattgtt tgaacaagaa 5700
aagaagttgc aaaacaccat gaagcttttg cagctgagca agcgccagga aaaagtcatc 5760
tttgatcaat tggtcgtaac ccacaaaatc cttcggaagg ccagaggaaa cctggagctt 5820
aggcctgggg gagcccatcc aggaacatgc agtcccagca gaccaggctc ctgagaagaa 5880
ctttcagcca ataaagcttg tgcttccccc accgagctca cgctgtctct ttgttccaag 5940
tgtggttcct atttattgag gaagaaagag ctgtctggcc aaaggaaatc tattttttcc 6000
cttcatgttt tctctctgaa agttggcttg agagttgttg tcagaaaggt gcaggtgctc 6060
cacaaacggg tggtaaaaag gcctcgagct cttggatgtt gtatttcaga tcaggggcag 6120
gcaccggagt tgaggctgtg cgccttggtg ggcttcacgt cttcccctgg atttgcttag 6180
tactcagcca gtgccacagt ttgaagattc tcattaaatg attcatttca tttcaccttg 6240
aa 6242
<210> 12
<211> 2701
<212> DNA
<213> 智人
<400> 12
gggggctcga gctgcggcgc cggctcctgc cgcctgggcc ccgggcccgg cccctcccgc 60
gccgcccggg cgatgagaag ctgcttctgc gtgagacgga gccgggaccc gccgccgccg 120
cagccaccgc cgccgccgcc ccagcgggga acagaccagt ccaccatgcc tgaagtcaaa 180
gacctctcag aagccttgcc agaaacatca atggatccca tcacgggagt cggggtggtg 240
gcttctcgga accgagcccc gacaggctat gacgtagttg cacagacagc agatggtgtg 300
gatgctgacc tctggaaaga cggcttattt aaatccaagg ttaccagata cctgtgtttc 360
acaagatcat tttccaaaga aaatagtcat ctggggaacg tgttagtaga tatgaagctc 420
attgacatca aggacacact gcctgtgggc ttcatcccaa ttcaggagac ggtggacaca 480
caggaagtgg cttttaggaa gaagaggctg tgcattaaat ttattccacg ggattcaacg 540
gaagctgcga tttgtgacat tcggatcatg ggccggacca agcaggcccc gcctcagtac 600
acgtttattg gggaactgaa cagcatgggg atctggtatc gaatgggcag agtaccaaga 660
aatcatgact catctcaacc cacaacgcct tcccagtcat cagctgcctc caccccagcc 720
cccaaccttc ccaggtgagg ccttgtcggg gtgtcttgca ttgtcctgtg gtcttaggtc 780
cctgcacaac attttagaac accaccactt agtgtctgct gaaatactgc aaagtacagc 840
tgaataattg tagaagcaat atatctttag aggagatttt taaaaatcca cttggaaatc 900
tttgcattac atgaatgcaa aggccattct atagtctatt ttgtgcgtgt tctgcaggct 960
tctaaaattg cagattatgc aacttaaaat tggctcccta ttcaaaagag ctgctagcta 1020
cacacagaca cgtgctgtat agccatgggg ttgggatcac tggccttaag gtcaaattcc 1080
ttctctgtct tggccagcaa ctcatttgaa acccaggagg gtaggtgagt tcttatattc 1140
ttcattttca tataatttct ttttccaatg agctataaag taagaaatgg gtagtttggg 1200
tatgagagaa tagtgaggag tttttcagga aatgctagtt ttaacaattg tctccgcaaa 1260
gaaacttggg tgagccaact gtttgctctg caactgattt cagtcataac agaggtagta 1320
acagtctcta cactttctgc aaaaagaatc ctgtcaaata aaaatcctgt gcatcactag 1380
gagtaaacta agggcaagga acaaacagca ctgatggatt aagcttgaga aagggattgc 1440
aaaagtaaat aaaacaagaa cggtgaggca gcaacactta gggattgaca taacgtaaat 1500
gagaatggat ctccaagctt ccacgtgggt gaatagagat gaacaaaatc tgtcaggaac 1560
cggacagaag agtcaccagt aggtcttcct gggccatcca caatacagcc tgccctccgg 1620
gacataccac cagctctctg tactctgttc ctctgtgcca agcctccgtc tcacttggaa 1680
gaatgtgctg taatgaggct ccaaagccct gaggactctg tcctctggga catcccccta 1740
taaagacaat ctggtccttc tcatgacagt ttcacaaacc aagagtggta tttaaactta 1800
actacccctg gaattgcctg aaactttaga agtagttttc agtttcattt ggcataaaaa 1860
gataggaatc tctaataagc ctcccagagt tgcagggtga acagttgagt ctctgttggg 1920
ttcaagagtg tgaggttcgc actgcccatc agcacttgtt cctcacttct gagccagagc 1980
gctgtcagct ccgccctgga gggcactgct gagggtcact gtctcctgtg ctcaaggcta 2040
tatcaggtgt gtcacctgtg ctggggagtc agctaagtcc atcacctgtg tgtcggggtc 2100
ctccatcacc tgtgctgagg cccatcactt gtacttggag cagctcaagt gtgggctcct 2160
tgcagaggct ggaaagcccc cacaggagca gttgccctga agttgttaca gctgctccct 2220
gctgacatca tgtggtctag aagggcccag aaatgggcac cacctcaggc aggttttgac 2280
tttctgtggt taaagaaaga acaccagttc tctcatataa agcagagaga gctctcagaa 2340
gcctgctggt gactgtgaga gcaaagtcac ttgcacctga agcaagacag ccgagaacac 2400
cgagccaccg gcagcctggt gggtttggag ggtagtgcgt cagaaccaga tgtttataag 2460
gcttatgtat tttatcacct ctgctgtaca gtttatggtt tacaatggct gcaaggaaat 2520
cggatcagtt ttgttttact tgccaaataa aacaaatgtc aaaatagtca atataaaatg 2580
tattctaatt tggctgagtt aagtcagcca atatgcaaca ggataattga atgttcatta 2640
atgcttccaa gtaaaagcca tttgtctgtc agaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2700
a 2701
<210> 13
<211> 2870
<212> DNA
<213> 智人
<400> 13
gcgggcgtca gcgcggtggc cagcgcgcag aggcgggcgc ggaggcggct agaaggtgac 60
cgcggatccc agcttcctgc agccagccct gaaggatggc tgccatattg ggagacacca 120
tcatggtggc taaaggcctt gtcaagctga cccaggcggc cgtggaaacc cacctgcagc 180
acttgggcat cggaggggag ctgatcatgg cggccagggc cctgcagtcc acggctgtgg 240
agcagattgg catgttcttg gggaaggtgc agggtcagga taaacatgaa gaatattttg 300
ctgagaactt cggcggccca gaaggggagt tccacttctc agtcccgcat gcagccggag 360
cctccacaga cttctcttca gcctccgctc ccgaccagtc agcgccccca tccctgggtc 420
atgcccacag cgagggccca gctcctgcct acgtggccag tggacccttt agagaagccg 480
ggttccccgg ccaggcctcc tcccctctgg gcagggccaa cgggaggctc tttgcaaacc 540
ccagagactc attctctgcc atgggctttc agcgaaggtt cttccaccag gaccaatccc 600
ctgttggggg cctcacagcc gaggacattg agaaggcccg gcaggctaag gctcgccccg 660
agaacaagca gcacaaacag acgctcagcg agcatgcccg ggagcggaag gtgcctgtga 720
cgaggattgg ccggctggcc aacttcggag gtctggccgt gggcctgggc ttcggggcac 780
tggcagaggt cgccaagaag agcctgcgct ccgaggaccc ctcagggaag aaggccgtgc 840
tgggttccag tcctttcctg tccgaggcca atgcagagcg gatcgtgcgc acgctctgca 900
aggtgcgtgg tgcggcactc aagctgggcc agatgctgag catccaggat gatgccttta 960
tcaaccccca cctggctaag atcttcgagc gggtgcggca gagcgcggac ttcatgccac 1020
tgaagcagat gatgaaaact ctcaacaacg acctgggccc caactggcgg gacaagttgg 1080
aatacttcga ggagcggccc ttcgccgccg catccattgg gcaggtgcac ttggcccgaa 1140
tgaagggcgg ccgcgaggtg gccatgaaga tccagtaccc tggcgtggcc cagagcatca 1200
acagtgatgt caacaacctc atggccgtgt tgaacatgag caacatgctt ccagaaggcc 1260
tgttccccga gcacctgatc gacgtgctga ggcgggagct ggccctggag tgtgactacc 1320
agcgagaggc cgcctgtgcc cgcaagttca gggacctgct gaagggccac cccttcttct 1380
atgtgcctga gattgtggat gagctctgca gcccacatgt gctgaccaca gagctggtgt 1440
ctggcttccc cctggaccag gccgaagggc tcagccagga gattcggaac gagatctgct 1500
acaacatcct ggttctgtgc ctgagggagc tgtttgagtt ccacttcatg caaacagacc 1560
ccaactggtc caacttcttc tatgaccccc agcagcacaa ggtggctctt ttggattttg 1620
gggcaacgcg ggaatatgac agatccttca ccgacctcta cattcagatc atcagggctg 1680
ctgccgacag ggacagggag actgtgcggg cgaaatccat agagatgaag ttcctcaccg 1740
gctacgaggt caaggtcatg gaagacgccc acttggatgc catcctcatc ctgggggagg 1800
ccttcgcctc cgatgagcct tttgattttg gcactcagag caccaccgag aagatccaca 1860
acctgattcc cgtcatgctg aggcaccgtc tcgtcccccc acccgaggaa acctactccc 1920
tgcacaggaa gatggggggc tccttcctca tctgctccaa gctgaaggcc cgcttcccct 1980
gcaaggccat gttcgaggag gcctacagca actactgcaa gaggcaggcc cagcagtagg 2040
gctgcgggcc acgcccaggc cggctccgcg ggaactctct ccctcagaca ggccaaaaac 2100
cagtagcgag gtcgtggtga tgctcttttt aactcctttg cccaataagg ggggtggctg 2160
cctggagccc cgtagccagc gctttccacg gtttctgttg ctaaatggtt gtagggtgag 2220
aagtgcaaga atgaagatga agccccactg ctcggtcagt ctgcctccgt gtgtcctctg 2280
aaataagcag atgaagatga aagggcaact ttgttttctt ctttttcctg atgtgaatgt 2340
taagcagaag ggagagagtc cttactccct tccaatctct gttcagtgca aaacccagaa 2400
acatgaacag atacgattgt gggattttta tcatctgtgt agtaggtgtg tgtatgtgtt 2460
tctagagtga gatttgtgtt ttctgccctt ttcctctcca gccgatgggc tggagctggg 2520
agaggtgctg agctaacagt gccaacaagt gctccttaag cctgcgaggc ccaggcctgt 2580
ggggctggtt ctcacctttg acagctgaat gttcctaaag aactgctgcc ccacagtgag 2640
ggtgggagca gcggaacagg gaatgccaga cacaggctcg ctgctgctgg aaggcggggt 2700
gggacttcct tcctctgtcc ggaaaggcac aggtgtcacc agttccagcc aaaggctcct 2760
cacaggcgct gtgaattttt gtacaagtct tgtaattatc gaatcaacaa cttgttttca 2820
atttaataaa aatgctcatg ggaagtgaaa aaaaaaaaaa aaaaaaaaaa 2870
<210> 14
<211> 2307
<212> DNA
<213> 智人
<400> 14
gaagccgggg gcgggggcca cgcgtggggc aggcggtgct cggctcggct gacgtcggcc 60
cgccggcgcc ccaccagctc cgcgcgggcc cgggttggcc accgccgggc ccccgcccct 120
cccccggcgg tgtcccggcc ggaaccgatc gtggctggtt tgagctggtg cgtctccatg 180
gcgacccgcc ggtgctataa gtagggagcg gcgtgccgtg gggctttgtc agtccctcct 240
gtagccgccg ccgccgccgc ccgccgcccc tctgccagca gctccggcgc cacctcgggc 300
cggcgtctcc ggcgggcggg agccaggcgc tgacgggcgc ggcgggggcg gccgagcgct 360
cctgcggctg cgactcaggc tccggcgtct gcgcttcccc atggggctgg cctgcggcgc 420
ctgggcgctc tgagattgtc actgctgttc caagggcaca cgcagaggga tttggaattc 480
ctggagagtt gcctttgtga gaagctggaa atatttcttt caattccatc tcttagtttt 540
ccataggaac atcaagaaat catgaacaac tttggtaatg aagagtttga ctgccacttc 600
ctcgatgaag gttttactgc caaggacatt ctggaccaga aaattaatga agtttcttct 660
tctgatgata aggatgcctt ctatgtggca gacctgggag acattctaaa gaaacatctg 720
aggtggttaa aagctctccc tcgtgtcacc cccttttatg cagtcaaatg taatgatagc 780
aaagccatcg tgaagaccct tgctgctacc gggacaggat ttgactgtgc tagcaagact 840
gaaatacagt tggtgcagag tctgggggtg cctccagaga ggattatcta tgcaaatcct 900
tgtaaacaag tatctcaaat taagtatgct gctaataatg gagtccagat gatgactttt 960
gatagtgaag ttgagttgat gaaagttgcc agagcacatc ccaaagcaaa gttggttttg 1020
cggattgcca ctgatgattc caaagcagtc tgtcgtctca gtgtgaaatt cggtgccacg 1080
ctcagaacca gcaggctcct tttggaacgg gcgaaagagc taaatatcga tgttgttggt 1140
gtcagcttcc atgtaggaag cggctgtacc gatcctgaga ccttcgtgca ggcaatctct 1200
gatgcccgct gtgtttttga catgggggct gaggttggtt tcagcatgta tctgcttgat 1260
attggcggtg gctttcctgg atctgaggat gtgaaactta aatttgaaga gatcaccggc 1320
gtaatcaacc cagcgttgga caaatacttt ccgtcagact ctggagtgag aatcatagct 1380
gagcccggca gatactatgt tgcatcagct ttcacgcttg cagttaatat cattgccaag 1440
aaaattgtat taaaggaaca gacgggctct gatgacgaag atgagtcgag tgagcagacc 1500
tttatgtatt atgtgaatga tggcgtctat ggatcattta attgcatact ctatgaccac 1560
gcacatgtaa agccccttct gcaaaagaga cctaaaccag atgagaagta ttattcatcc 1620
agcatatggg gaccaacatg tgatggcctc gatcggattg ttgagcgctg tgacctgcct 1680
gaaatgcatg tgggtgattg gatgctcttt gaaaacatgg gcgcttacac tgttgctgct 1740
gcctctacgt tcaatggctt ccagaggccg acgatctact atgtgatgtc agggcctgcg 1800
tggcaactca tgcagcaatt ccagaacccc gacttcccac ccgaagtaga ggaacaggat 1860
gccagcaccc tgcctgtgtc ttgtgcctgg gagagtggga tgaaacgcca cagagcagcc 1920
tgtgcttcgg ctagtattaa tgtgtagata gcactctggt agctgttaac tgcaagttta 1980
gcttgaatta agggatttgg ggggaccatg taacttaatt actgctagtt ttgaaatgtc 2040
tttgtaagag tagggtcgcc atgatgcagc catatggaag actaggatat gggtcacact 2100
tatctgtgtt cctatggaaa ctatttgaat atttgtttta tatggatttt tattcactct 2160
tcagacacgc tactcaagag tgcccctcag ctgctgaaca agcatttgta gcttgtacaa 2220
tggcagaatg ggccaaaagc ttagtgttgt gacctgtttt taaaataaag tatcttgaaa 2280
taattaggca ttgggacgtt aaaaaaa 2307
<210> 15
<211> 5392
<212> DNA
<213> 智人
<400> 15
gccccgcccc cgaaggcgag ctgcgctgac agccggcggc gggctgggtg tttgcaatac 60
aaaggcggcc acgcgcggcg ccgctcggtg cagaccatga attacgtggg gcagttagcc 120
ggccaggtgt ttgtcaccgt gaaggagctc tacaaggggc tgaatcccgc cacactctca 180
gggtgcattg acatcattgt catccgccag cccaatggaa acctccaatg ctcccctttc 240
cacgtccgct ttgggaagat gggggtcctg cgctcccgag agaaagtggt tgacatagaa 300
atcaatgggg aatctgtgga tttgcatatg aaattgggag ataatggaga agcatttttt 360
gttcaagaaa cagataatga tcaggaagtt atccctatgc acctggccac ctcccccatc 420
ctgtcagaag gagcttcgag aatggaatgc cagctgaaaa ggggctctgt ggacaggatg 480
agaggcctgg accccagcac gccagcccaa gtgatcgctc ccagcgagac gccgtcaagc 540
agctctgtag taaagaagag aagaaaaagg aggagaaagt cacagctgga cagcctgaag 600
agagatgaca acatgaacac atctgaggat gaggacatgt tccccatcga gatgagctcg 660
gatgaggcca tggagctgct ggagagcagc agaactcttc ctaatgatat acctccattc 720
caagatgata ttcctgagga aaacctctcc ctggctgtga tttaccctca gtcagcctca 780
taccctaatt cggatagaga gtggtcaccc actcccagtc cttccggttc ccgaccttca 840
acacctaaaa gtgattcaga attggtcagc aagtccacgg aaaggacagg gcagaagaac 900
ccagaaatgc tttggctgtg gggagagctg ccgcaggctg ctaagtcttc ttctccacac 960
aagatgaaag agtccagccc attgagcagt agaaaaattt gtgataaaag tcactttcag 1020
gccattcaca gcgaatcttc agacactttt agtgaccaat cgccaactct ggtcggtggg 1080
gcacttttgg accagaacaa gcctcagaca gaaatgcagt ttgtgaatga agaagacctg 1140
gagaccttag gagcagcagc gccactcttg cccatgatcg aggagctcaa acccccctct 1200
gccagtgtag tccagacagc aaacaagacg gattctcctt ccaggaaaag agataaacga 1260
agccgacatc ttggtgctga cggcgtctac ttggatgacc tcacagacat ggatcctgaa 1320
gtggcggccc tgtattttcc caaaaacgga gatccttccg gactcgcaaa acatgcaagc 1380
gacaacggag cccggtcagc caaccagtcc ccgcagtcgg tgggcagctc gggcgtggac 1440
agtggcgtgg agagcacctc ggacgggctg agggacctcc cttccatcgc catctccctc 1500
tgcgggggcc tcagcgacca ccgggagatc acgaaagatg cattcctgga gcaagctgtg 1560
tcatatcaac agtttgtgga caaccccgct attatcgatg accccaatct cgtggtaaag 1620
attgggagta aatattataa ctggacaaca gcagcacccc tcctcctggc aatgcaggcc 1680
ttccagaaac ctttgccaaa ggccactgtg gaatctatca tgagggataa aatgcccaaa 1740
aagggaggaa gatggtggtt ttcatggagg ggaagaaaca ccacaatcaa ggaggaaagt 1800
aagccagagc agtgcttggc tggcaaggcc catagcaccg gagagcaacc gccgcagctc 1860
agcttggcca ccagggtaaa gcatgaatca tcctccagtg atgaggagcg cgcagctgcc 1920
aagccatcaa acgcaggcca cctccctctt ctgcctaatg tcagctacaa gaagactctc 1980
cggctgactt ccgagcagct taaaagcttg aagttgaaga atggccccaa cgacgtggtt 2040
ttcagtgtca ccacgcagta ccaaggcacg tgccgctgtg agggcaccat ctatctgtgg 2100
aactgggatg ataaagtcat catttctgat attgatggga caattaccag atcagatact 2160
cttggccaca ttttgcccac ccttgggaag gattggaccc atcagggcat cgctaagctg 2220
taccataaag tgagccagaa tggatataaa tttctctact gttctgcccg tgccatcggg 2280
atggcggaca tgacgcgggg ctacctgcac tgggtcaacg agaggggcac ggtgctgccc 2340
caggggcccc tgctgctgag tcccagcagc ctcttctctg ccctgcacag agaagtgatt 2400
gaaaagaagc cagaaaagtt taaagtccag tgtttgacag acatcaaaaa cctgtttttc 2460
cccaacacag aaccctttta tgctgctttt ggaaaccgac cagctgatgt gtattcatac 2520
aagcaagtag gagtgtcttt gaatagaata tttaccgtca accctaaagg agagctggta 2580
caggaacatg caaagaccaa catctcttcg tatgtgagac tctgtgaagt agtcgaccac 2640
gttttcccgt tgctgaaaag aagccattct tcagactttc cctgttcgga taccttcagt 2700
aacttcacct tttggagaga gccactgcca ccttttgaaa accaggacat tcattctgcc 2760
tcagcgtaaa atgtcccaag cagcctcttg ccagcagtgc agagcctggt tgtcacccat 2820
taaaggatag gtctccccgg agtgcacagc tccacctggg agcctggcgc gtcatcattg 2880
gcctgacagc agagagaatt gagaagcatt tctcccctgc cccaccccgg ggctgacatt 2940
tctaagcaag ataggaaggg agcactttct aggctaggag ttgggtgcat ttgtaccgtg 3000
aaaagcattc ctcagttgtg gcttaatgcc agttacgacg ctgcctttcc ggcctgctcc 3060
agcaagtagc tactggttca cgtgcagttt ggggctgtga aacctaggca gaaggcggct 3120
gtctgagggc tgtccccgcc taggacaggg tcaatcgagg aatgccagat gtgcacggtt 3180
tttggcaaag tagggggcac atttccatta tagcaatgtt agtgccacca ccttctgaac 3240
acagtgggga gggctgtgaa ggctcatgtg acctggatct gaggtctctg atagaaatct 3300
ggacgccacc gggtccaggc ctggcctcag acttggcctt gtggatgggc cccttacagt 3360
atttgctgac tagtctcatt tttaggtgat aaatttttct ttaattcctt tggttaaaga 3420
tagtctattt cattggcata tctcccccca gtttttgtgg ctcaaggctg gaatatttat 3480
gccttaatat atctatggca gacatttaag aatgcgcttt atctagctca tggtaacttt 3540
gcaacgcctt agattaaaat gacagtaaat attactaagg cagtattttg aatgagtttg 3600
acactgccgg cttccttcca tccagcgagg tggtgctgac agtgtggact tgagcacact 3660
tatgccaaat gataatgata ctgacttctg ttgggagctc tccaaagaaa ctggttggtt 3720
ttaagaaaat agtttcaaga agttcaacta tattctttta gatattatgt attgttttac 3780
tctgattagg ttactgtgat aggcatttat tcatattctt tctataccac tgtcattaat 3840
atattaaaaa gatgtatgtg ttagactatc gaaagggcct tattctctct ttctcataga 3900
ctgaccttct tttggaattt ctgagtcatt tattttcctt agctttttcc actcaaatta 3960
agggcaagcg aaaaagtaat aatttggcat tctttaagcc tacagaatgt gattctttca 4020
cttgtttatt acactggctc gtggacagaa caatttgaaa agtgaaagaa ttattttggt 4080
aaaagatttt gctttacttt tcgaagcatt atttttttaa agagtgtttt actccaacga 4140
ttgaaacatt ttcctattta aatttcattg ttagaatcac aggaggcaaa aaatggaacg 4200
gttgaatgaa attttactct ttctgtgaaa gaaaatccac agagttgttg cctccgttgt 4260
agttggtggg ccccgttagc attggatgcc tttgccaaat ggttcatgtg gacacacaaa 4320
ggcaaacaga tctgccatcg atcgcagatt tctgtagaaa cacggatgtg catgtgcaga 4380
ttcccttttg caggtattaa aaataattaa aaatagtcct gcctgaggtt gcagtgagcc 4440
gagcttgcac tactgcactc cagcctgggt gacagagtaa gactccatgt caaaaaaaaa 4500
aaaaaaaaaa aaaaagtcct gccttaacta actcctctgc gcttgttcac tagtaaccta 4560
aagaggctat attcattctt tatgcaatga gggtattttt gagtgaattt taactgctct 4620
gaactaagta taagctcatg ggcctgcaaa ggttcagacg gtttctcctt tgcacccagg 4680
aggaactttg gctgcgagaa tggggggatg tatccctcat gcagttggca tccaggcagc 4740
cctctgcagc agcacaccct gcaggcggag ttttcagagg atgcaatttt ggatcccgaa 4800
ttttgatgta ccttaaactt ccacatcact gcaccctgaa acagagcatg ctttccagaa 4860
agtcacactc tcagatctgt gtcaagttca atgtgagccc tggcaaggct ggcatattaa 4920
cacctgcctt ctggcttctg aaagtgagat ttgtatatgg gctgcactca cgcatatacg 4980
agttggttta tctttgtgta catgactata acccagtgat gctgaggtca tgtgctggaa 5040
tgctgtattt ggaccacaca tttcaaagtt gccctatgga aatgaatcct acttagtgac 5100
aagtcatcaa atgtttgtca catgtgatga agacaaatat gtatacctgg catagagaaa 5160
aatatatacc tggtacattg gagaaaaata attacacttt caaagagaat tccctttgca 5220
attttatgtt tggatcacca ctgtaagcac actttatttg catttgatct gtatttgtat 5280
atgctgatgc aatgataaaa atcactgtaa tacttcattg tgttgtactg gatgcaaagc 5340
tagaaaatat tgcaataaat gagaccgatg aaagacttct ctgaaaaaaa aa 5392
<210> 16
<211> 3230
<212> DNA
<213> 智人
<400> 16
agcagtgttc tcttcgtccc cctcccccaa actgaggatt gggcaatacc acagaacctc 60
aggaaagggg ggaagagcga gcttcggccc cactaatggg ggagtgggcg gaggctggat 120
ttcccacctc ggctgcacct gggcactgga ggctgaagag gaaagtgaga atctgaagtt 180
ttgagacctc tgactggcca ggaatagctc ctggggcggg gggcaaggat gggaccatag 240
gcggaaagag tctcgcggtc ccccctgctt ctggcgcggg tccctgcgcc cggttgtgga 300
gcgtctcgcg cggggagggg gcggggggaa cggcagctcg cggtgttgtt cactcgcgcg 360
tcgagcacac ggtgggtccg gcggcgggtt ggcgccccag gcggcgttcc ctgtggcctg 420
gcgcctgggc cgctgccctg agcgggttcc gccccagagc ccgaccctcc tgggggctct 480
aggcggagtc ccgcgagccg agggggaccg gcgaccgctg ccgaagcatg aagaaggggt 540
aaggcgtgag cccccaagat ttcacgcatg ccccctagct tcggtactct gacaccttct 600
cttgcacttg cggatgatga actggaataa cgatgaaaga aagcacatcc gatctcaaca 660
ttcacgtcct gccctataac cgattaatta attgatcccc agctagacta gtgttggaga 720
aatcagcatg ttaaaacaac tgttgatgat agctgttgga gtaaagttgc agtggaagct 780
atggctgcaa aatcgttaaa atcttcaagg tgaactggca caaaggttaa tctcaagatg 840
ccgctagtga aaagaaacat cgatcctagg cacttgtgcc acacagcact gcctagaggc 900
attaagaatg aactggaatg tgtaaccaat atttccttgg caaatataat tagacaacta 960
agtagcctaa gtaaatatgc tgaagatata tttggagaat tattcaatga agcacatagt 1020
ttttccttca gagtcaactc attgcaagaa cgtgtggacc gtttatctgt tagtgttaca 1080
cagcttgatc caaaggaaga agaattgtct ttgcaagata taacaatgag gaaagctttc 1140
cgaagttcta caattcaaga ccagcagctt ttcgatcgca agactttgcc tattccatta 1200
caggagacgt acgatgtttg tgaacagcct ccacctctca atatactcac tccttataga 1260
gatgatggta aagaaggtct gaagttttat accaatcctt cgtatttctt tgatctatgg 1320
aaagaaaaaa tgttgcaaga tacagaggat aagaggaagg aaaagaggaa gcagaagcag 1380
aaaaatctag atcgtcctca tgaaccagaa aaagtgccaa gagcacctca tgacaggcgg 1440
cgagaatggc agaagctggc ccaaggtcca gagctggctg aagatgatgc taatctctta 1500
cataagcata ttgaagttgc taatggccca gcctctcatt ttgaaacaag acctcagaca 1560
tacgtggatc atatggatgg atcttactca ctttctgcct tgccatttag tcagatgagt 1620
gagcttctga ctagagctga ggaaagggta ttagtcagac cacatgaacc acctccacct 1680
ccaccaatgc atggagcagg agatgcaaaa ccgataccca cctgtatcag ttctgctaca 1740
ggtttgatag aaaatcgccc tcagtcacca gctacaggca gaacacctgt gtttgtgagc 1800
cccactcccc cacctcctcc accacctctt ccatctgcct tgtcaacttc ctcattaaga 1860
gcttcaatga cttcaactcc tccccctcca gtacctcccc cacctccacc tccagccact 1920
gctttgcaag ctccagcagt accaccacct ccagctcctc ttcagattgc ccctggagtt 1980
cttcacccag ctcctcctcc aattgcacct cctctagtac agccctctcc accagtagct 2040
agagctgccc cagtatgtga gactgtacca gttcatccac tcccacaagg tgaagttcag 2100
gggctgcctc cacccccacc accgcctcct ctgcctccac ctggcattcg accatcatca 2160
cctgtcacag ttacagctct tgctcatcct ccctctgggc tacatccaac tccatctact 2220
gccccaggtc cccatgttcc attaatgcct ccatctcctc catcacaagt tatacctgct 2280
tctgagccaa agcgccatcc atcaacccta cctgtaatca gtgatgccag gagtgtgcta 2340
ctggaagcaa tacgaaaagg tattcagcta cgcaaagtag aagagcagcg tgaacaggaa 2400
gctaagcatg aacgcattga aaacgatgtt gccaccatcc tgtctcgccg tattgctgtt 2460
gaatatagtg attcggaaga tgattcagaa tttgatgaag tagattggtt ggagtaagaa 2520
aaatgcattg ataaatatta caaaactgaa tgcaaatgtc ctttgtggtg cttgttcctt 2580
gaaaatgttt ggtcattcta gtgttttgct ttcttttcct tataataaat gacccttttc 2640
ctccataact tttgatttct aaggaaaata ttagcataca tttcaaacta aatgttttac 2700
agtggcttat cttttttttc cccctgaaaa gactaatttg gtcaaataaa ccactaagta 2760
ttaagcatgg acagctgttg ttagagtagc agattcagtt ttttgatata tcttaattgt 2820
gtactttgtg aattttaatt taaagaaagc aactgaaatt gaaatcttga gggcagctgt 2880
gtctactaat gagccttatt ccatttcctg atgttttaaa agaagaaaca ctgccttgat 2940
tatacgaata cactcagaaa gtacatttag cttgtagtgt tgaattctct taaaggaatg 3000
cttgaatttt ttcattattg ttttattgtt tttatatact tgccttattt gaatgtttag 3060
cagtatcccc ttcccactta tatattgtgt gatatgattt tgcttgccta taggagttaa 3120
aaacttttcc atgtgaaata ctctgactta aacatacatg taacttacat aactgttaag 3180
aataacagtc tgatttaata aatggttcat tttaaaagtt aaaaaaaaaa 3230
<210> 17
<211> 7933
<212> DNA
<213> 智人
<400> 17
gctcgctggc gccgccgccg ccggcagacc ccgcgctccg gctccggctc ggctcgctcg 60
gctccggtgc gcgccgaggc catgcagcgc cggggcgccc tgttcggcat gccgggcggc 120
agcggaggca ggaagatggc tgcaggagac atcggcgagc tgctagtgcc ccacatgccc 180
acgatccgcg tgcccaggtc cggcgacagg gtctacaaga acgagtgcgc cttctcctac 240
gactctccca attctgaagg tggactctat gtatgcatga atacattttt ggcctttgga 300
agggaacatg ttgaaagaca ttttcgaaaa actggacaga gtgtatacat gcacctgaaa 360
agacatgtgc gagagaaggt aagaggggcg tctggtggag cgttaccaaa aaggaggaat 420
tccaagattt ttttagatct agatactgat gacgatttaa atagcgacga ttatgaatat 480
gaagatgaag ccaaacttgt tatattccca gatcactatg aaatagcact accaaatatt 540
gaggagttac cagccctggt aacaattgct tgtgatgcag ttctcagctc aaaatctcca 600
tacagaaagc aggacccaga cacgtgggaa aatgaattgc cagtatctaa atatgccaac 660
aacctcaccc agctggacaa tggagtcagg attcctccaa gtggttggaa gtgtgccaga 720
tgcgacctgc gagaaaacct ctggttgaat ctgactgacg gctctgtcct gtgtggaaag 780
tggttctttg acagctctgg gggcaacggg catgcgctgg agcattacag agacatgggc 840
tacccactag ccgtgaaact gggaaccatc actcctgacg gggcagatgt ttattctttt 900
caagaagaag aacctgtttt ggatcctcat ttggccaagc acttagcgca ttttggaatt 960
gatatgcttc atatgcatgg gacagagaat gggctccagg acaatgacat caagctgagg 1020
gtcagtgagt gggaagtgat ccaggagtcg ggcacgaaac tgaagccaat gtatggtcct 1080
ggctacacgg gtctgaagaa cctgggcaac agctgctatc tcagctctgt catgcaggcc 1140
atcttcagca tcccagaatt ccagagagcg tatgtaggaa accttcccag aatatttgac 1200
tactcgcctt tagatccaac acaagatttc aacacacaga tgactaagtt aggacatggc 1260
cttctctcag gccagtattc aaagcctccg gtgaaatctg aactcattga acaggtgatg 1320
aaggaggagc acaagccaca gcagaacggg atctctccgc gcatgtttaa ggcctttgta 1380
agcaagagcc acccggaatt ctcctctaac aggcagcaag atgcccagga attcttcttg 1440
cacctggtga atctagtaga gaggaaccgc atcggctcag aaaacccaag cgatgttttt 1500
cgttttttgg tggaagaacg cattcagtgc tgtcagaccc ggaaagtccg ctacacggag 1560
agggtggatt acctgatgca gttacctgtg gccatggagg cggcaaccaa caaggatgaa 1620
ctgatcgctt atgaactaac gagaagggaa gcagaagcaa acagaagacc ccttcctgag 1680
ttggtacgtg ccaagatacc atttagtgcc tgccttcagg ccttctctga accagaaaat 1740
gttgatgatt tctggagcag tgccctacaa gcaaagtctg cgggtgtgaa aacatctcgc 1800
tttgcttcat tccctgaata cttggtagtg cagataaaga agttcacttt tggtcttgac 1860
tgggttccca aaaaatttga tgtttctatt gatatgccag acctacttga tatcaaccat 1920
ctccgagcca gggggttaca gccaggagag gaagaacttc cagacatcag cccccccata 1980
gtcattcctg atgactcaaa agatcgcctg atgaaccaat tgatagaccc atcagacatc 2040
gatgagtcat cagtgatgca gctggccgag atgggtttcc cgctggaagc atgtcgcaag 2100
gctgtgtact tcactggaaa tatgggcgcc gaggtggcct tcaactggat cattgttcac 2160
atggaagagc cagattttgc tgagccgctg accatgcctg gttatggagg ggcagcttct 2220
gctggagcct ctgtttttgg tgcttctgga ctggataacc aacctccaga ggaaatcgta 2280
gctatcatca cctccatggg atttcagcga aatcaggcta ttcaggcact acgagcaacg 2340
aataataacc tggaaagagc actggattgg atctttagcc accctgagtt tgaagaagac 2400
agtgattttg tgattgagat ggagaataat gccaatgcaa acattatttc tgaggccaag 2460
cccgaaggac ctagagtcaa ggatggatct ggaacatatg agctatttgc attcatcagt 2520
cacatgggaa catccacaat gagtggtcat tacatttgcc atatcaaaaa ggaaggaaga 2580
tgggtgattt acaatgacca caaagtttgt gcctcagaaa ggccccctaa agacctgggc 2640
tacatgtact tttaccgcag gataccaagc taaacctcaa atataaaaat tggcgaaaag 2700
aagccatacg cctttttaat ttgccaaaaa aaaaaagaag aagaagaagt tgaaacaact 2760
agacatgaag gaatatatgg ggtatttatc gtttatttaa agagcacgat cagttgacac 2820
cttctgaaat agaactgaga agaaatttct attagtgatg atacactatt atattgtaga 2880
tagtttttat aaatgttcaa aaagatgatg atatttaaaa acaaaaaaag tattcatatt 2940
gctggtggag gatctgccat cagcacatca aaaatgggga tgtgccccca gccctctatt 3000
ttgctttggg ggtcagtgat agtggcctct ggagaaacca aataatgtgg ccagtggtgt 3060
ggccttaccc acaacaaatg aaaagcccac ttgtgtttca tatagaaaat cagcagttgg 3120
gtggggcttt atttgtgaca taattttttt catgacatac aataatttct gatgtatcca 3180
tgtagatatt atgctctgtc cataatagag cctctgcaat gaaagatatt tttaatttgt 3240
cacattaaaa ttcataatac gattgtgtga atgtgtgtga gactgactga gagtgtgaga 3300
cttttactag aaaagtgagt ccactagaaa atctgtgaca agttggtttt taaagtctga 3360
acagttgata ttaagcatat ctgaaaaaag caagtaaata ttttaacaaa actatgactc 3420
aggaaccttc gagaagatta gttccccact tagattttta aggagtaaaa agggctgagt 3480
tatgccttta agtgctgtca agaattcact tgggtttggg acatttgctg gtgtaatgct 3540
agatgcccac agcagcataa tattgtactt tgtcaaaggt aggtaaattc tctgtttctc 3600
agcagccctt tccccaaaag gtatggtgtt tatttttagt aaaaatagct aatctctttt 3660
taccatctca catgataact ctttggagtc atgtcaagtg ccccaaattt gtctgtgatt 3720
ttcccatctc tgagctcttt atctgcctcc gtttccttgt ttttctgggg ccagagtctc 3780
atctctgcct ttttttggtg tatcaccttc tgacttgcct tcattgcttg tctgatgtga 3840
ccaacagtgt gatcttggac acactaagga ttttagatgc aaagaaactt tatacaacat 3900
tatgaaagac tatcctttcc attttggtta tttcagcatt ttagttgcaa cctgggatta 3960
gattagagtt tccaacgtga tgaaaagtgg aatgatagca ttctataatt tccataattt 4020
tcctactggt ccgtaccaaa ttctagagtc tctggagttg ctatttcaga gtatttggtc 4080
aaacgaaaaa gaatttattg ctgtctgttt aacatgtatt tgtttggttg aaaggatctt 4140
tttagaaact gtaggaaaat aaacagaacc aaccaggtga aacaaagcac agacattggg 4200
ttaggatgta gtgagttgtg aacaatcagg attctgggtg tgatgggggt ccctgtctca 4260
taggtgatcc tttggtgcca tgtgaccgag agacatggtg tctaaggccc atggcctgga 4320
gacctgggtg ctgctcctag ctgactgtgg accttgggca agtccttcat ccgtcctgtg 4380
cctcactgtc ctcatctgaa caatggtatg atgacacctg ccctctcttt caatcatgct 4440
ttgaggatac agtgagattg gttacagtga accttcaatg agtagaatgt ggtatgccat 4500
ggtgggttgt agtagatggt gctccctgcc ttttctcctc tgttttcctc aatttgggaa 4560
caaatgagat tggcagaagg agggagctca cggtgcagta cttttctacc aaagtgtgcc 4620
cactggtgtc acctcctaat gttaacttgg atttcctaaa gcagtcccac tctgttatga 4680
gagtcactga ctcccgtgga catccccaca gtaagcagcc ttacaaaatc cagtcccctt 4740
agggcagagt gagtgtcata gaataatgac tccaaaccca cgtcaaaaat ggcttgtttt 4800
cagcgatgtt ataaaacaaa ggcctgtttt ttggaattgg gggtgactgg gtggtttgga 4860
ttgaaatgtg gacaaagata gcatgtgtat tttgaataaa ataaaaattt tgtaataaaa 4920
cttttaaaaa tcagtgatgt aaaatcaata tttaagacta taggctataa attgtttgat 4980
ttcattaact agcccttttg atgcctagac atgttgtaaa aaaattgtgc tatggctgcc 5040
ttttcttctg ccccacaaca caaagggcta tttctacaag gcaaagtttt gtatatgtgc 5100
tattctttac ttcagattga gagttgggaa aaactggagt aaataatggg tttcttactt 5160
gcttaaaagc atatttatat gtgtatctca atatatacaa ggcaggttcc cctataaaag 5220
tctggaatgt actgcttaat tttacacttg tgtagacacg attatttgtg actgaaaagt 5280
ggaataacgt gtggattttg tcaactcatt atcagtctgt tagcagtcct ctatgtgagg 5340
catggtggtc taattgtgaa attctccctg tatatgggtg tctgtgtgaa agacagcact 5400
ttcttcctgt aaatatcttt tgatatccat ttatgtagaa ttccaatgaa tatgtctttg 5460
gaaaaggtaa tgtatcaaag tttttatttt gccaattgat ctaaatgccc atataactaa 5520
tcagaaatcc agtttggttc agattgggat tttcttttaa agaaaaaaaa agtatgcaga 5580
aaagactatt ggaagaatca tgtgttagtg acactttaca tcaacgttgc ttcaatattt 5640
tggaattgac caggctgctt tctcctacct gcaagagaat gtgcctgaca tttcccagtg 5700
cttactttgg gctataggaa gtccagcggg gatagctcga gcctcttgct ccctgagtca 5760
tttattccct ttacctgaac agagccttac ctgcaattca tagtgagagc acctgggtct 5820
gtatcctgac tccactctaa gtgaggtggg actgaatcac tgtacctctc tgggcctttt 5880
catttgaaac aagtgggtta gactagatta gctccaaagt cctctcttgc cctaacattt 5940
tatttttatt ttcctgtggt taccactagg gtctgacacg taaaatgtga gggatcactt 6000
agaggtttgg atgttatatt tttgcattgt tacagcttat actccccagt tgaggacctg 6060
tgtcattctt agtggcccca cgacccctct gtttgtattc ctgctccact tatctatact 6120
tttttgggta atcatcccac tttttttttt tcttgagatg gagtctcgct gtgttgccaa 6180
ggctggagta cagtggtgca atctcagctc actgcagcct cctcccgggt tcaagtgatt 6240
ctcctgcctc agcttcccaa gtagctggga ttactggcgc acgccactac gcccagctaa 6300
tttttgtatt tttagtagag acagggtttt gccatgttgg ccaggctggt cttgaactct 6360
tgacctcaac ctgcctcagc ctcccaaagt gctgggatta cacgcatgag ctaccgcgtc 6420
cagccccact ttttttctac tcttgaaaaa aacaactttc tagtccatga ggtactttgg 6480
ctccatcccc ctcaaaaaca aaacaaaaaa tccatttaaa gtgtcctcct agaaaagcct 6540
cagaactgcc ttcaactaca tctgtcacct ttatagaata ttttgaaatt ctggaagagg 6600
atgggaaaca aaattctaat ttagctagag ctgtgatccc caaataagtg ctgacaaaat 6660
tgtctaccac agaaaggccg tccttgtcat cttgtaggca tcactgctgc taaatcacat 6720
cagtacatgc cttctgtggg gagatggcag ggggcagggg caggaccagg ggatgggatt 6780
agataaagtg tgataatgtc ctttagataa aagaaatcct acgctataga acaaggttct 6840
gtactcttga gttggtgtct gagatcacct gcacagtgtt acagagattt tccactccat 6900
aaatcactct aaaagagttt gcataagact cggtagacct gtgctattca atgtggcagt 6960
caacagccat atgtggcgat gactactcaa agtttggctt gttcaaatcg agactgtgtt 7020
gtacacatac aatacacacc agattttgaa ggcttggtac caaaaaggaa tttaaaatat 7080
ttcaccaata tttcatattg ataacatgct gaaatgacac tattttggat gtactaagta 7140
aaatattaac aatttaatat atttatataa ttgaaattaa aattcttttc acccattttt 7200
atttttttaa aaatgtggcc cctaaagaac ttcaaattag acatgtggat aacgttatac 7260
ttctattgga cagccccact ctagacttac atggtgtggg gtaggcagtg aaatccgtaa 7320
ataggaaacg caattctgca aagtatctaa atagacagaa acaacacaaa tatttttgct 7380
ggagtcagga gcactgtgag gcacagaaca tctcccagaa agcagatttt ttttttctgc 7440
cgaaaaacca atatatatat gtatgatccc aattaaaaga caaaagcaaa tgagccccaa 7500
actgcctgtc ttcagctttg cctgggagct gctacctttg ctcttctagc atcttctagg 7560
taccaaggat attagccact tgagggtgtt gggcatattt gtttcattgt aggcaaaatc 7620
ctcttgtggt ttcccctccc caggtattgt tgagtctgtt caaagctggg tgtgttgaaa 7680
cactgcacaa atcctgccac tcttgatgtg ccgcttgtct cagccttggc agaggctgag 7740
tctgttcctg tgcccacctg tccagcaggt tttgatgttg gctcctgaaa gagtttgtat 7800
ttattttatt ttgcactagt cacagttgtt gttaaactgt atcaaatgtt ttgggagatt 7860
atttgcctga gatggaaaga gagatggatg atttattgct tcaattgttt taaattaaaa 7920
gctattctca caa 7933
<210> 18
<211> 7218
<212> DNA
<213> 智人
<400> 18
tgctggcctg gcgcgcgcgc gggcgggagc ggagggcaac ggggcggcgc gggcggccgg 60
gcgcagggtc gcgggaggtg acgcgcggcg aggatggcgg cgcggggccg ggggctgctg 120
ctgctgacgc tgtcggtgct gttggcggcg ggcccctccg ccgctgcggc caagctcaac 180
atccccaaag tgctgctgcc cttcacgcgg gccacgcgcg ttaacttcac gctggaggcc 240
tcggagggct gctaccgctg gttgtccacc cggccggagg tggccagcat cgagccgctg 300
ggcctggacg agcagcagtg ctcccagaag gcagtggtgc aggcccgcct gacccagcct 360
gcccgcctca ccagcatcat cttcgcagag gacatcacca caggccaggt cctgcgctgt 420
gatgccattg tggacctcat ccatgacatc cagatcgtct ccaccacccg cgagctctac 480
ctggaggact cccccctgga gctgaagatc caggccctgg actccgaagg gaacaccttc 540
agcactctgg ctggactggt cttcgagtgg acgattgtga aggactccga ggcggacagg 600
ttctcagact cccacaatgc gctgcgaatc ctcactttct tggagtctac gtacatccct 660
ccttcttaca tctcagagat ggagaaggct gccaagcaag gggacaccat cctggtgtct 720
gggatgaaga ccgggagctc caagctcaag gctcgcatcc aggaggctgt ctacaagaat 780
gtacgccctg cagaagtcag gctgctgatt ttggaaaaca tccttctgaa cccggcctat 840
gacgtctacc tgatggtggg aacctccatt cactacaagg tgcagaagat caggcaaggg 900
aaaattacag aactctccat gccttccgat cagtacgagt tgcagcttca gaacagcatc 960
ccgggccccg aaggagaccc agcccggccg gtggctgtct tggcccagga cacgtcgatg 1020
gtcactgcac tgcagctggg acagagcagc ctcgtccttg gccacaggag tattcgcatg 1080
caaggtgctt ctaggttacc caacagcact atctacgtgg tcgaacctgg atacctaggg 1140
ttcactgttc accctggtga caggtgggtg ctggagaccg gccgcctgta tgaaatcacc 1200
atcgaagttt ttgacaagtt cagcaacaag gtctatgtat ctgacaacat ccgaattgaa 1260
actgtgcttc ctgctgagtt cttcgaggtg ctctcgtcct cccagaatgg gtcataccat 1320
cgcatcaggg cactaaagag gggacagacg gccattgacg cggccctcac ctctgtggtg 1380
gaccaggatg gaggggtcca catactacag gtgcctgtgt ggaaccagca ggaggtggaa 1440
attcacatcc cgatcaccct gtatcccagc atcttgacat ttccgtggca accaaagacg 1500
ggcgcctatc agtacacaat aagggcccac ggtggcagtg ggaacttcag ctggtcttcg 1560
tcaagccacc tggttgccac agttactgtc aagggcgtga tgaccacagg cagtgacatc 1620
gggttcagtg tgatccaggc acatgatgtg cagaacccac tccatttcgg tgagatgaag 1680
gtgtatgtga tcgagcccca cagcatggag tttgccccgt gccaggtgga ggcacgtgtg 1740
ggccaggccc tggagctgcc cctgaggatc agtggcctca tgcccggcgg ggccagtgag 1800
gtggtcacct tgagcgactg ctcccacttt gacttggctg tcgaggtgga gaaccagggt 1860
gtgttccagc cactcccagg gaggctgccg ccaggctctg agcactgcag cggcatccgg 1920
gtaaaggccg aggcccaggg ctctaccacg cttcttgtga gctacagaca cggccacgtc 1980
cacctgagtg ccaagatcac cattgctgcc tacctgcccc tcaaggctgt ggatccctcc 2040
tctgttgcct tggtaaccct gggctcctca aaggagatgc tgtttgaagg aggtcccaga 2100
ccttggatcc tcgagccgtc caaattcttc cagaacgtca ccgctgagga cactgacagc 2160
atcggcctgg ctctctttgc cccccattcc tcccggaatt atcagcaaca ctggatcctt 2220
gtgacctgtc aggccttggg tgagcaggtc atcgccctgt cggtggggaa caagcccagc 2280
ctcaccaacc cctttcctgc ggtggagcct gccgtggtga agttcgtctg cgccccaccg 2340
tccaggctca ccctcgcgcc tgtctacacc agcccccagc tggacatgtc ctgtccgctg 2400
ctgcagcaga acaagcaggt ggtcccagtg tccagccacc gcaacccccg gctggacctg 2460
gctgcttacg accaggaggg ccgccggttc gacaacttca gctctctgag catccagtgg 2520
gagtccacca ggccagtgtt ggccagcatc gagcctgagc tgcccatgca gctggtgtcc 2580
caggacgatg agagtggcca aaagaagctg cacggtttgc aggccatttt ggttcacgag 2640
gcatcaggaa ccacagccat cactgccact gccactggct accaggagtc ccacctcagc 2700
tctgccagaa caaagcagcc gcatgaccct ctggtgcctc tgtcggcctc catagagctc 2760
atcctggtgg aggacgtgag ggtgagccca gaagaggtga ccatctacaa ccaccctggc 2820
atccaggcag agctccgcat cagggaaggc tcaggttact tcttcctcaa caccagcacc 2880
gcagatgttg tcaaggtggc ctaccaggag gccaggggtg tcgccatggt gcaccctttg 2940
ctcccgggct catccaccat catgatccat gacttgtgcc tcgtcttccc ggccccagcc 3000
aaggctgtcg tttacgtgtc ggacattcag gagctgtaca tccgtgtggt tgacaaggtg 3060
gagattggga agacagtgaa ggcatacgtc cgcgtgctgg acttgcacaa gaagcccttc 3120
cttgccaaat acttcccctt tatggacctg aagctccgag cagcctcccc gatcattaca 3180
ttggtggccc ttgatgaagc ccttgacaac tacaccatca cattcctcat ccgcggtgtg 3240
gccatcggcc agaccagtct aactgcaagt gtgaccaata aagctggaca gagaatcaac 3300
tcagccccac aacagattga agtctttccc ccgttcaggc tgatgcccag gaaggtgaca 3360
ctgcttatcg gggccacgat gcaggtcacc tccgagggcg gcccccagcc tcagtccaac 3420
atccttttct ccatcagcaa tgagagcgtt gcgctggtga gcgctgctgg gctggtacag 3480
ggcctcgcca tcgggaacgg cactgtgtct gggctcgtgc aggcagtgga tgcagagacc 3540
ggcaaggtgg tcatcatctc tcaggacctc gtgcaggtgg aggtgctgct gctaagggcc 3600
gtgaggatcc gcgcccccat catgcggatg aggacgggca cccagatgcc catctatgtc 3660
accggcatca ccaaccacca gaaccctttc tcctttggca atgccgtgcc aggcctgacc 3720
ttccactggt ctgtcaccaa gcgggacgtc ctggacctcc gagggcggca ccacgaggcg 3780
tcgatccgac tcccgtcaca gtacaacttt gccatgaacg tgctcggccg ggtaaaaggc 3840
cggaccgggc tgagggtggt ggtcaaggct gtggacccca catcggggca gctgtatggc 3900
ctggccagag aactctcgga tgagatccaa gtccaggtgt ttgagaagct gcagctgctc 3960
aaccctgaaa tagaagcaga acaaatatta atgtcgccca actcatatat aaagctgcag 4020
acaaacaggg atggtgcagc ctctctgagc taccgcgtcc tggatggacc cgaaaaggtt 4080
ccagttgtgc atgttgatga gaaaggcttt ctagcatcag ggtctatgat cgggacatcc 4140
accatcgaag tgattgcaca agagcccttt ggggccaacc aaaccatcat tgttgctgta 4200
aaggtatccc ctgtttccta cctgagggtt tccatgagcc ctgtcctgca cacccagaac 4260
aaggaggccc tggtggccgt gcctttggga atgaccgtga ccttcactgt ccacttccac 4320
gacaactctg gagatgtctt ccatgctcac agttcggtcc tcaactttgc cactaacaga 4380
gacgactttg tgcagatcgg gaagggcccc accaacaaca cctgcgttgt ccgcacagtc 4440
agcgtgggcc tgacactgct ccgtgtgtgg gacgcagagc acccgggcct ctcggacttc 4500
atgcccctgc ctgtcctaca ggccatctcc ccagagctgt ctggggccat ggtggtgggg 4560
gacgtgctct gtctggccac tgttctgacc agcctggaag gcctctcagg aacctggagc 4620
tcctcggcca acagcatcct ccacatcgac cccaagacgg gtgtggctgt ggcccgggcc 4680
gtgggatccg tgacggttta ctatgaggtc gctgggcacc tgaggaccta caaggaggtg 4740
gtggtcagcg tccctcagag gatcatggcc cgtcacctcc accccatcca gaccagcttc 4800
caggaggcta cagcctccaa agtgattgtt gccgtgggag acagaagctc taacctgaga 4860
ggcgagtgca cccccaccca gagggaagtc atccaggcct tgcacccaga gaccctcatc 4920
agctgccagt cccagttcaa gccggccgtc tttgatttcc catctcaaga tgtgttcacc 4980
gtggagccac agtttgacac tgctctcggc cagtacttct gctcaatcac aatgcacagg 5040
ctgacggaca agcagcggaa gcacctgagc atgaagaaga cagctctggt ggtcagtgcc 5100
tccctctcca gcagccactt ctccacagag caggtggggg ccgaggtgcc cttcagccca 5160
ggtctcttcg ccgaccaggc tgaaatcctt ttgagcaacc actacaccag ttccgagatc 5220
agggtctttg gtgccccgga ggttctggag aacttggagg tgaaatccgg gtccccggcc 5280
gtgctggcat tcgcaaagga gaagtctttt gggtggccca gcttcatcac atacacggtc 5340
ggcgtcttgg accccgcggc tggcagccaa gggcctctgt ccactaccct gaccttctcc 5400
agccccgtga ccaaccaagc cattgccatc ccagtgacag tggcttttgt ggtggatcgc 5460
cgtgggcccg gtccttatgg agccagcctc ttccagcact tcctggattc ctaccaggtc 5520
atgttcttca cgctcttcgc cctgttggct gggacagcgg tcatgatcat agcctaccac 5580
actgtctgca cgccccggga tcttgctgtg cctgcagccc tcacgcctcg agccagccct 5640
ggacacagcc cccactattt cgctgcctca tcacccacat ctcccaatgc attgcctcct 5700
gctcgcaaag ccagccctcc ctcagggctg tggagcccag cctatgcctc ccactaggcc 5760
gcgtgaaggt tcccggagga tgggtctcag ccgagcctcg tgcaccccca agatggaaca 5820
tccctgctgc attcacactg gaacaagccc ctccagatga gtgccccggc cccaggccag 5880
cttcactgcc gtctcttcac acagagctgt agtttcggct ctgcccatta gctcatttta 5940
tgtaggagtt ttaaatgtgt gtttttttcc tttcaagtct tacaaagcta agactttttg 6000
gctcattcct ttttgcatgg ttgtctaggg tttctggaca atgtgctgtt gcatttttat 6060
tttcctagcc ttgctaaaat ctttcccttc tcaagacttt gagcagttag aagtgctctt 6120
tagaagttgt ctgtgggtga tgttactgta gtggtctcag ggaaaggatt gtccagttac 6180
tttagggggt ttttggtggg gtttttcccc ctgtgaaaac ttactttgcc cctagtctgg 6240
ctgctgctag gacttctgag gagcaatggg acatgagtgt ccctgtatct gcgccactgc 6300
cgcaagggaa gcctcaggaa ccagcacctg gaggccagga tagccaagcc ctgggtgagc 6360
gagaggctgg agaacacagg agctcaccca gggctgctgc ccaaccatgg gccactgtga 6420
acagacttca gtcctctgtt tttgtttcat aagccgttga gacatctgat ggacttggct 6480
taggccctgc tgggacatcc cacgtgtgat ccctttcact ccatcaggac accaggactg 6540
tccttaggaa aatgtccttg agatggcagc aggagtcata ttttctgtgt gtgtgtttcg 6600
gaaagccgct gtgtcctgcc tcagcacaaa gacccagtgt catttgctcc tcctgttcct 6660
gtgccactcc agaacctcag cagatctgag ccaccgcctg ccagtgtgag aggcggccac 6720
tttcatggca gctcatcagg cgcagggccc cagacagctt cccagcaggc cctagagccc 6780
ggcctgggcc aatgatggag ggcggccgcc agcccagggc ctgcccatcc agaagggact 6840
ccccagggcc tgggggagga gacccttgga aaagtcctct cttcccagct cctgattctg 6900
gatctgagat tctcagatca caggcccctg tgctccaggc cgaggctggg ctaccctcag 6960
ggagatccag agactcatgc ccatggccat ccatgcgtgg acgctgtgtg gagagtccag 7020
gatgacggga tcccgcacaa gctcccttca gtccttcagg gctgggccat gtggttgatt 7080
tttctaaagc tggagaaagg aagaattgtg ccttgcatat tacttgagct taaactgaca 7140
acctggatgt aaataggagc ctttctactg gtttatttaa taaagttcta tgtgattttt 7200
taagagggaa aaaaaaaa 7218
<210> 19
<211> 6780
<212> DNA
<213> 智人
<400> 19
gattgccacc caggacgatg agcggctgag atggagacgt ctgcctcagc cactgcctcc 60
gagaagcaag aagccaaaag tgggatcctg gaggccgctg gcttccccga cccgggtaaa 120
aaggcctctc ctttggtggt ggctgcagcg gcagcagcag cggtagctgc ccaaggagtg 180
ccgcagcatc tcttgccacc attccatgcg cccctaccga ttgacatgcg acaccaggaa 240
ggaaggtacc attacgagcc tcattctgtc cacggtgtgc acgggccccc tgccctcagc 300
ggcagccctg tcatctctga catctccttg atccggcttt ccccgcaccc ggctggccct 360
ggggagtccc ccttcaacgc cccccacccg tacgtgaacc cccacatgga gcactacctc 420
cgttctgtgc acagcagccc cacgctctcc atgatctctg cagccagggg cctcagcccc 480
gctgatgtgg cccaggagca ccttaaggag aggggactgt ttggccttcc tgctccaggc 540
accaccccct cagactatta ccaccagatg accctcgtgg caggccaccc cgcgccctac 600
ggggacctgc tgatgcagag cgggggcgct gccagcgcac cccatctcca cgactacctc 660
aaccccgtgg acgtgtcccg tttctccagc ccgcgggtga cgccccgcct gagccgcaag 720
cgggcgctgt ccatctcccc actctcagac gccagcctgg acctgcagcg gatgatccgc 780
acctcaccca actcgctagt ggcctacatc aacaactccc gaagcagctc ggcggccagc 840
ggttcctacg ggcatctgtc agcgggtgcc ctcagcccag ccttcacctt cccccacccc 900
atcaaccccg tggcctacca gcagattctg agccagcaga ggggtctggg gtcagccttt 960
ggacacacac cacccctgat ccagccctca cccaccttcc tggcccagca gcccatggcc 1020
ctcacctcca tcaatgccac gcccacccag ctcagcagca gcagcaactg tctgagtgac 1080
accaaccaga acaagcagag cagtgagtcg gccgtcagca gcaccgtcaa ccctgtcgcc 1140
attcacaagc gcagcaaggt caagaccgag cctgagggcc tgcggccggc ctcccctctg 1200
gcgctgacgc agggccaggt gtctggacac ggctcatgtg ggtgtgccct tcccctctcc 1260
caggagcagc tggctgacct caaggaagat ctggacaggg atgactgtaa gcaggaggct 1320
gaggtggtca tctatgagac caactgccac tgggaagact gcaccaagga gtacgacacc 1380
caggagcagc tggtgcatca catcaacaac gagcacatcc acggggagaa gaaggagttt 1440
gtgtgccgct ggcaggcctg cacgcgggag cagaagccct tcaaggcgca gtacatgctg 1500
gtggtgcaca tgcggcgaca cacgggcgag aagccccaca agtgcacgtt cgagggctgc 1560
tcgaaggcct actcccgcct ggagaacctg aagacacacc tgcggtccca caccggggag 1620
aagccatatg tgtgtgagca cgagggctgc aacaaagcct tctccaacgc ctcggaccgc 1680
gccaagcacc agaatcgcac ccactccaac gagaaaccct acatctgcaa gatcccaggc 1740
tgcaccaaga gatacacaga ccccagctct ctccggaagc atgtgaaaac ggtccacggc 1800
ccagatgccc acgtcaccaa gaagcagcgc aatgacgtgc acctccgcac accgctgctc 1860
aaagagaatg gggacagtga ggccggcacg gagcctggcg gcccagagag caccgaggcc 1920
agcagcacca gccaggccgt ggaggactgc ctgcacgtca gagccatcaa gaccgagagc 1980
tccgggctgt gtcagtccag ccccggggcc cagtcgtcct gcagcagcga gccctctcct 2040
ctgggcagtg cccccaacaa tgacagtggc gtggagatgc cggggacggg gcccgggagc 2100
ctgggagacc tgacggcact ggatgacaca cccccagggg ccgacacctc agccctggct 2160
gccccctccg ctggtggcct ccagctgcgc aaacacatga ccaccatgca ccggttcgag 2220
cagctcaaga aggagaagct caagtcactc aaggattcct gctcatgggc cgggccgact 2280
ccacacacgc ggaacaccaa gctgcctccc ctcccgggaa gtggctccat cctggaaaac 2340
ttcagtggca gtgggggcgg cgggcccgcg gggctgctgc cgaacccgcg gctgtcggag 2400
ctgtccgcga gcgaggtgac catgctgagc cagctgcagg agcgccgcga cagctccacc 2460
agcacggtca gctcggccta caccgtgagc cgccgctcct ccggcatctc cccctacttc 2520
tccagccgcc gctccagcga ggcctcgccc ctgggcgccg gccgcccgca caacgcgagc 2580
tccgctgact cctacgaccc catctccacg gacgcgtcgc ggcgctcgag cgaggccagc 2640
cagtgcagcg gcggctccgg gctgctcaac ctcacgccgg cgcagcagta cagcctgcgg 2700
gccaagtacg cggcagccac tggcggcccc ccgcccactc cgctgccggg cctggagcgc 2760
atgagcctgc ggaccaggct ggcgctgctg gacgcgcccg agcgcacgct gcccgccggc 2820
tgcccacgcc cactggggcc gcggcgtggc agcgacgggc cgacctatgg ccacggccac 2880
gcgggggctg cgcccgcctt cccccacgag gctccaggcg gcggagccag gcgggccagc 2940
gaccctgtgc ggcggcccga tgccctgtcc ctgccgcggg tgcagcgctt ccacagcacc 3000
cacaacgtga accccggccc gctgccgccc tgtgccgaca ggcgaggcct ccgcctgcag 3060
agccacccga gcaccgacgg cggcctggcc cgcggcgcct actcgccccg gccgcctagc 3120
atcagcgaga acgtggcgat ggaggccgtg gcggcaggag tggacggcgc ggggcccgag 3180
gccgacctgg ggctgccgga ggacgacctg gtgcttccag acgacgtggt gcagtacatc 3240
aaggcgcacg ccagtggcgc tctggacgag ggcaccgggc aggtgtatcc cacggaaagc 3300
actggcttct ctgacaaccc cagactaccc agcccggggc tgcacggcca gcgcaggatg 3360
gtggctgcgg actccaacgt gggcccctcc gcccctatgc tgggaggatg ccagttaggc 3420
tttggggcgc cctccagcct gaacaaaaat aacatgcctg tgcagtggaa tgaggtgagc 3480
tccggcaccg tagacgccct ggccagccag gtgaagcctc caccctttcc tcagggcaac 3540
ctggcggtgg tgcagcagaa gcctgccttt ggccagtacc cgggctacag tccgcaaggc 3600
ctacaggcta gccctggggg cctggacagc acgcagccac acctgcagcc ccgcagcgga 3660
gccccctccc agggcatccc cagggtaaac tacatgcagc agctgcgaca gccagtggca 3720
ggcagccagt gtcctggcat gactaccact atgagccccc atgcctgcta tggccaagtc 3780
cacccccagc tgagccccag caccatcagt ggggccctca accagttccc ccaatcctgc 3840
agcaacatgc cagccaagcc agggcatctg gggcaccctc agcagacaga agtggcacct 3900
gaccccacca cgatgggcaa tcgccacagg gaacttgggg tccccgattc agccctggct 3960
ggagtgccac cacctcaccc agtccagagc tacccacagc agagccatca cctggcagcc 4020
tccatgagcc aggagggcta ccaccaggtc cccagccttc tgcctgcccg ccagcctggc 4080
ttcatggagc cccaaacagg cccgatgggg gtggctacag caggctttgg cctagtgcag 4140
ccccggcctc ccctcgagcc cagccccact ggccgccacc gtggggtacg tgctgtgcag 4200
cagcagctgg cctacgccag ggccacaggc catgccatgg ctgccatgcc gtccagtcag 4260
gaaacagcag aggctgtgcc caagggagcg atgggcaaca tggggtcggt gcctccccag 4320
ccgcctccgc aggacgcagg tggggccccg gaccacagca tgctctacta ctacggccag 4380
atccacatgt acgaacagga tggaggcctg gagaacctcg ggagctgcca ggtcatgcgg 4440
tcccagccac cacagccaca ggcctgtcag gacagcatcc agccccagcc cttgccctca 4500
ccaggggtca accaggtgtc cagcactgtg gactcccagc tcctggaggc cccccagatt 4560
gacttcgatg ccatcatgga tgatggcgat cactcgagtt tgttctcggg tgctctgagc 4620
cccagcctcc tccacagcct ctcccagaac tcctcccgcc tcaccacccc ccgaaactcc 4680
ttgaccctgc cctccatccc cgcaggcatc agcaacatgg ctgtcgggga catgagctcc 4740
atgctcacca gcctcgccga ggagagcaag ttcctgaaca tgatgaccta gaggcccgag 4800
cgcctggtgc tgagtgcacc cggaggggtc atcgctgccc agagcctggg gattccagct 4860
gtcttgtctt tttccaaaaa agtgttaaat aggcttgagg ggttgttgcg caatggccgc 4920
ttcagatgac agatgttgta agagaaggtt tatgggcatc ctctctggtc ttttggatta 4980
ttcctcagaa caatgaaaaa agtctccata ggacaggaag gaatgcaaaa ctcatttaca 5040
cagtgctttc cagcctttgg tgcttacagg accgcgctgt tccggcttct tcacggctga 5100
cattcggcta acgagggatt actttggcca aaacctttca aaggatatgc agaaagatgg 5160
tagggagcat ttgggtttga atctgaatgc tatactggat actctgctcc ggaaagatga 5220
gctttttatt ctactacttg gaaggaaaag gaattcctgg tccacctgaa ttcctctatg 5280
aagcctaact cttgaggtct ctaacatacc ttgtcataga ggaaaagcac agattatacc 5340
tggatgattc aggagcacat tctgattcca ggtttggtag agctggctct tctactccgt 5400
aaagccgagt ctgggactgg cagcccatcc aagtgtatat gaatgaataa agcatccaag 5460
tatatatgaa tgaataaagt atgtaagtat caccagaaaa aggaaagaaa aaatgtactc 5520
cttggggcaa gcccagaagc tgccctggcc tctccagacc gtgtttacag tgtttgcatg 5580
tagaatgtag cccttcctga aaagaagact tgtttctaaa tacctcgggg ctgctggagc 5640
cgctgtgggt tagggatgga ctgaggcctc gaggagtgag ggtgcacccg gggcccagcc 5700
tcaggctgcc ctagggatct ctcagtagga agaggaagtt gcgtgtttac ccaatcctgt 5760
ttctccaatg caacgtccac ccactttacc accaaaaact ccagggcctg acggcagccc 5820
ggtcccccag cactcaccag cagcccagtg ttctccacca agccacagtg tgcatgcctg 5880
gtatcctccg gattcccttc cttctgcccg ctgagtcact gggcagagaa tgatgacatg 5940
tgtaggtggt gtggttgggg gtggaaaggg gaaggggttg atcctcagga ctctgaggga 6000
gcatcgttga attttcctgt tcagtgtgac caagacccac ctggaaatgg aatttggaac 6060
tggcttcagg agacatcatt cctgaacaca ctgtagggtg aattggtgca tcttccccac 6120
catacacaca cacacacaca cacacacaca cacacacaca cacacacccc aaaccttttc 6180
atggggaatg tgtggcaacc ttgccaaaca gcaccactca gagtgtgact ctgactgtga 6240
ccttggcctt aatgaggaac ttcttaggag agtttgagga caaggccaac atcgtcatct 6300
gggctcgctg cgtcccagca catcaaactc tgtccagaga caaggccaac tgcaaatgaa 6360
agccagggaa cattgctaag ggtctgtggc tctgtggtgg tgttcatcgc cttcctgaga 6420
taggatttcc cttgccagtc ccaacctgta tatattctgt acagaagaca tccctgaata 6480
tactgtaggt gagtcgtcca gccaaattta tatctccaaa acatttttag ctttttctac 6540
atgctatgaa ttgagatgac atgctcaact tgtaaataag tctttttgta cattaaaaaa 6600
gtaatttttt cataatttat cttgtctatc tgcttccccc ttgacagtag ttaatgagaa 6660
cctgggcagt aaatttggtg cattcgagca gaaattaggc tgtatttttt cttaacagtg 6720
tcaaaattga ctatcccgcc tttgccaaga aatgtttaat gctgaggcaa aaaaaaaaaa 6780
<210> 20
<211> 3824
<212> DNA
<213> 智人
<400> 20
ggaagcgcag agcaggttca aacacagacg gcgggtgaac atggcgtcct cgacttggtc 60
tgagacgtga taggcctgcc ttctggttga agatgtggcg agtgaaaaaa ctgagcctca 120
gcctgtcgcc ttcgccccag acgggaaaac catctatgag aactcctctc cgtgaactta 180
ccctgcagcc cggtgccctc accaactctg gaaaaagatc ccccgcttgc tcctcgctga 240
ccccatcact gtgcaagctg gggctgcagg aaggcagcaa caactcatct ccagtggatt 300
ttgtaaataa caagaggaca gacttatctt cagaacattt cagtcattcc tcaaagtggc 360
tagaaacttg tcagcatgaa tcagatgagc agcctctaga tccaattccc caaattagct 420
ctactcctaa aacgtctgag gaagcagtag acccactggg caattatatg gttaaaacca 480
tcgtccttgt accatctcca ctggggcagc aacaagacat gatatttgag gcccgtttag 540
ataccatggc agagacaaac agcatatctt taaatggacc tttgagaaca gacgatctgg 600
tgagagagga ggtggcaccc tgcatgggag acaggttttc agaagttgct gctgtatctg 660
agaaacctat ctttcaggaa tctccgtccc atctcttaga ggagtctcca ccaaatccct 720
gttctgaaca actacattgc tccaaggaaa gcctgagcag tagaactgag gctgtgcgtg 780
aggacttagt accttctgaa agtaacgcct tcttgccttc ctctgttctc tggctttccc 840
cttcaactgc cttggcagca gatttccgtg tcaatcatgt ggacccagag gaggaaattg 900
tagagcatgg agctatggag gaaagagaaa tgaggtttcc cacacatcct aaggagtctg 960
aaacagaaga tcaagcactt gtctcaagtg tggaagatat tctgtccaca tgcctgacac 1020
caaatctagt agaaatggaa tcccaagaag ctccaggccc agcagtagaa gatgttggta 1080
ggattcttgg ctctgataca gagtcttgga tgtccccact ggcctggctg gaaaaaggtg 1140
taaatacctc cgtcatgctg gaaaatctcc gccaaagctt atcccttccc tcgatgcttc 1200
gggatgctgc aattggcact acccctttct ctacttgctc ggtggggact tggtttactc 1260
cttcagcacc acaggaaaag agtacaaaca catcccagac aggcctggtt ggcaccaagc 1320
acagtacttc tgagacagag cagctcctgt gtggccggcc tccagatctg actgccttgt 1380
ctcgacatga cttggaagat aacctgctga gctctcttgt cattctggag gttctctccc 1440
gccagcttcg ggactggaag agccagctgg ctgtccctca cccagaaacc caggacagta 1500
gcacacagac tgacacatct cacagtggga taactaataa acttcagcat cttaaggaga 1560
gccatgagat gggacaggcc ctacagcagg ccagaaatgt catgcaatca tgggtgctta 1620
tctctaaaga gctgatatcc ttgcttcacc tatccctgtt gcatttagaa gaagataaga 1680
ctactgtgag tcaggagtct cggcgtgcag aaacattggt ctgttgctgt tttgatttgc 1740
tgaagaaatt gagggcaaag ctccagagcc tcaaagcaga aagggaggag gcaaggcaca 1800
gagaggaaat ggctctcaga ggcaaggatg cggcagagat agtgttggag gctttctgtg 1860
cacacgccag ccagcgcatc agccagctgg aacaggacct agcatccatg cgggaattca 1920
gaggccttct gaaggatgcc cagacccaac tggtagggct tcatgccaag caagaagagc 1980
tggttcagca gacagtgagt cttacttcta ccttgcaaca agactggagg tccatgcaac 2040
tggattatac aacatggaca gctttgctga gtcggtcccg acaactcaca gagaaactca 2100
cagtcaagag ccagcaagcc ctgcaggaac gtgatgtggc aattgaggaa aagcaggagg 2160
tttctagggt gctggaacaa gtctctgccc agttagagga gtgcaaaggc caaacagaac 2220
aactggagtt ggaaaacagt cgtctagcaa cagatctccg ggctcagttg cagattctgg 2280
ccaacatgga cagccagcta aaagagctac agagtcagca tacccattgt gcccaggacc 2340
tggctatgaa ggatgagtta ctctgccagc ttacccagag caatgaggag caggctgctc 2400
aatggcaaaa ggaagagatg gcactaaaac acatgcaggc agaactgcag cagcaacaag 2460
ctgtcctggc caaagaggtg cgggacctga aagagacctt ggagtttgca gaccaggaga 2520
atcaggttgc tcacctggag ctgggtcagg ttgagtgtca attgaaaacc acactggaag 2580
tgctccggga gcgcagcttg cagtgtgaga acctcaagga cactgtagag aacctaacgg 2640
ctaaactggc cagcaccata gcagataacc aggagcaaga tctggagaaa acacggcagt 2700
actctcaaaa gctagggctg ctgactgagc aactacagag cctgactctc tttctacaga 2760
caaaactaaa ggagaagact gaacaagaga cccttctgct gagtacagcc tgtcctccca 2820
cccaggaaca ccctctgcct aatgacagga ccttcctggg aagcatcttg acagcagtgg 2880
cagatgaaga gccagaatca actcctgtgc ccttgcttgg aagtgacaag agtgctttca 2940
cccgagtagc atcaatggtt tcccttcagc ccgcagagac cccaggcatg gaggagagcc 3000
tggcagaaat gagtattatg actactgagc ttcagagtct ttgttccctg ctacaagagt 3060
ctaaagaaga agccatcagg actctgcagc gaaaaatttg tgagctgcaa gctaggctgc 3120
aggcccagga agaacagcat caggaagtcc agaaggcaaa agaagcagac atagagaagc 3180
tgaaccaggc cttgtgcttg cgctacaaga atgaaaagga gctccaggaa gtgatacagc 3240
agcagaatga gaagatccta gaacagatag acaagagtgg cgagctcata agccttagag 3300
aggaggtgac ccaccttacc cgctcacttc ggcgtgcgga gacagagacc aaagtgctcc 3360
aggaggccct ggcaggccag ctggactcca actgccagcc tatggccacc aattggatcc 3420
aggagaaagt gtggctctct caggaggtgg acaaactgag agtgatgttc ctggagatga 3480
aaaatgagaa ggaaaaactc atgatcaagt tccagagcca tagaaatatc ctagaggaga 3540
accttcggcg ctctgacaag gagttagaaa aactagatga cattgttcag catatttata 3600
agaccctgct ctctattcca gaggtggtga ggggatgcaa agaactacag ggattgctgg 3660
aatttctgag ctaagaaact gaaagccaga atctgcttca cctcttttta cctgcaatac 3720
ccccttaccc caataccaag accaactggc atagagccaa ctgagataaa tgctatttaa 3780
ataaagtgta tttaatgaat ttctccaaaa aaaaaaaaaa aaaa 3824
<210> 21
<211> 3519
<212> DNA
<213> 智人
<400> 21
ctcacacgcc ggctcggatg atctcctgcc atgactcagc gcttctcgca ggctgccctg 60
ctggggacac cggcttcgct cgggcccctc ccgacgcgtc caccccctct cgccacccac 120
gcccgccccc agccgctggg cctttcccag tgcggccgcc gccgccacag ctgcagtcag 180
caccgtcacc ccagcagcat ccgccgcctg caccgcgcgt gcggcccgcc ccggcctgac 240
cccgccgccg aacccggcgc cagccatgga gcccgaagcc ccccgtcgcc gccacaccca 300
tcagcgcggc tacctgctga cacggaaccc tcacctcaac aaggacttgg cctttaccct 360
ggaagagaga cagcaattga acattcatgg attgttgcca ccttccttca acagtcagga 420
gatccaggtt cttagagtag taaaaaattt cgagcatctg aactctgact ttgacaggta 480
tcttctctta atggatctcc aagatagaaa tgaaaaactc ttttatagag tgctgacatc 540
tgacattgag aaattcatgc ctattgttta tactcccact gtgggtctgg cttgccaaca 600
atatagtttg gtgtttcgga agccaagagg tctctttatt actatccacg atcgagggca 660
tattgcttca gttctcaatg catggccaga agatgtcatc aaggccattg tggtgactga 720
tggagagcgt attcttggct tgggagacct tggctgtaat ggaatgggca tccctgtggg 780
taaattggct ctatatacag cttgcggagg gatgaatcct caagaatgtc tgcctgtcat 840
tctggatgtg ggaaccgaaa atgaggagtt acttaaagat ccactctaca ttggactacg 900
gcagagaaga gtaagaggtt ctgaatatga tgattttttg gacgaattca tggaggcagt 960
ttcttccaag tatggcatga attgccttat tcagtttgaa gattttgcca atgtgaatgc 1020
atttcgtctc ctgaacaagt atcgaaacca gtattgcaca ttcaatgatg atattcaagg 1080
aacagcatct gttgcagttg caggtctcct tgcagctctt cgaataacca agaacaaact 1140
gtctgatcaa acaatactat tccaaggagc tggagaggct gccctaggga ttgcacacct 1200
gattgtgatg gccttggaaa aagaaggttt accaaaagag aaagccatca aaaagatatg 1260
gctggttgat tcaaaaggat taatagttaa gggacgtgct tccttaacac aagagaaaga 1320
gaagtttgcc catgaacatg aagaaatgaa gaacctagaa gccattgttc aagaaataaa 1380
accaactgcc ctcataggag ttgctgcaat tggtggtgca ttctcagaac aaattctcaa 1440
agatatggct gccttcaatg aacggcctat tatttttgct ttgagtaatc caactagcaa 1500
agcagaatgt tctgcagagc agtgctacaa aataaccaag ggacgtgcaa tttttgccag 1560
tggcagtcct tttgatccag tcactcttcc aaatggacag accctatatc ctggccaagg 1620
caacaattcc tatgtgttcc ctggagttgc tcttggtgtt gtggcgtgtg gattgaggca 1680
gatcacagat aatattttcc tcactactgc tgaggttata gctcagcaag tgtcagataa 1740
acacttggaa gagggtcggc tttatcctcc tttgaatacc attagagatg tttctctgaa 1800
aattgcagaa aagattgtga aagatgcata ccaagaaaag acagccacag tttatcctga 1860
accgcaaaac aaagaagcat ttgtccgctc ccagatgtat agtactgatt atgaccagat 1920
tctacctgat tgttattctt ggcctgaaga ggtgcagaaa atacagacca aagttgacca 1980
gtaggataat agcaaacatt tctaactcta ttaatgaggt ctttaaacct ttcataattt 2040
ttaaaggttg gaatctttta taatgattca taagacactt agattaagat tttactttaa 2100
cagtctaaaa attgatagaa gaatatcgat ataaattggg ataaacatca catgagacaa 2160
ttttgcttca ctttgccttc tggttattta tggtttctgt ctgaattatt ctgcctacgt 2220
tctctttaaa agctgttgta cgtactacgg agaaactcat catttttata caggacacta 2280
atgggaagac caaaattact aataaattga cataaccaac attaaaactc ataattattt 2340
tgttgaccat tttgttaaaa tctacttttc aaaaaaaaaa agctagaaat gaatctaggc 2400
gtaggtgaac ttttgctaag cagaaataac actactttgt tgcctagaga aagataactt 2460
ctcaagtatt tttattccag tcctagatca tatatgttct tttgtgcaac ggaattctaa 2520
cagttctaag agaaagatca ctgctgttta cagcgccttg tgcagcctta gattttaata 2580
ttcttttgtc attgttacat ctcatagagt aaagctctta ttaccttgat cctgagtcag 2640
aaatcccacc tgaaatcacc ttttttcccc cttgatcaaa catcccatcc ttcagctacc 2700
atactgttgc tacagggatt ttgtggactg tggcccctgt cccgaggttg gcaccttcag 2760
ttcagcacag cctgagcagt gagaaggtct gaaaggagag tatatagtta agatccttga 2820
gaaagggctg cctgaggaac tgacctctta aagatctcag gatctttaag acaacaagtt 2880
aggttcctac tggagttacc tgccagaatg gcctcttaat taactcaggt aatgaagagc 2940
taactgtgtt ataatcatct tgcttttgcc tgaatttgga gaaagtatta taattaagtt 3000
cccagtatca gaaatgtcct tacataagat taaaatatct tgatgactaa taccattcta 3060
tgagaaagag tagttatatg cccagactgt attaatttac tttagaaact aatgtttgaa 3120
gtaatggaaa aaattttaaa ttataaagct aaggtgcaat aacatttgct acttatttat 3180
agaattattt gaagaatttt gtttttgaag taatgcttta aggagtataa gatattcaag 3240
ataaattata ctataaaatg attttattga aagttgaagg ttacacaaat tgttttaggt 3300
atgagcagaa gaggttaagg tatttctaaa ggtaacatat agtcaagagt ttcctcaaaa 3360
tagttatttg gagaagaatc agaatgtctg tgtatttctt gtctgtttct atgttgtctt 3420
atagctctga ctaaatgtgt ttacctatgc aaaagattta ttaaagcata gaaaaggtga 3480
atgaataaaa atataaaata attgtccttt ttcttaaaa 3519
<210> 22
<211> 1319
<212> DNA
<213> 智人
<400> 22
cgcgcccgtc ccgtcgccgc cgccgccgcc gcagacccct cggtcttgct atgtcgagct 60
cacccgtgaa gcgtcagagg atggagtccg cgctggacca gctcaagcag ttcaccaccg 120
tggtggccga cacgggcgac ttccacgcca tcgacgagta caagccccag gatgctacca 180
ccaacccgtc cctgatcctg gccgcagcac agatgcccgc ttaccaggag ctggtggagg 240
aggcgattgc ctatggccgg aagctgggcg ggtcacaaga ggaccagatt aaaaatgcta 300
ttgataaact ttttgtgttg tttggagcag aaatactaaa gaagattccg ggccgagtat 360
ccacagaagt agacgcaagg ctctcctttg ataaagatgc gatggtggcc agagccaggc 420
ggctcatcga gctctacaag gaagctggga tcagcaagga ccgaattctt ataaagctgt 480
catcaacctg ggaaggaatt caggctggaa aggagctcga ggagcagcac ggcatccact 540
gcaacatgac gttactcttc tccttcgccc aggctgtggc ctgtgccgag gcgggtgtga 600
ccctcatctc cccatttgtt gggcgcatcc ttgattggca tgtggcaaac accgacaaga 660
aatcctatga gcccctggaa gaccctgggg taaagagtgt cactaaaatc tacaactact 720
acaagaagtt tagctacaaa accattgtca tgggcgcctc cttccgcaac acgggcgaga 780
tcaaagcact ggccggctgt gacttcctca ccatctcacc caagctcctg ggagagctgc 840
tgcaggacaa cgccaagctg gtgcctgtgc tctcagccaa ggcggcccaa gccagtgacc 900
tggaaaaaat ccacctggat gagaagtctt tccgttggtt gcacaacgag gaccagatgg 960
ctgtggagaa gctctctgac gggatccgca agtttgccgc tgatgcagtg aagctggagc 1020
ggatgctgac agaacgaatg ttcaatgcag agaatggaaa gtagcgcatc cctgaggctg 1080
gactccagat ctgcaccgcc ggccagctgg gatctgactg cacgtggctt ctgatgaatc 1140
ttgcgttttt tacaaattgg agcagggaca gatcatagat ttctgatttt atgtaaaatt 1200
ttgcctaata cattaaagca gtcacttttc ctgtgctgtt tcaaaaaaaa aaaaaaaaaa 1260
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 1319
<210> 23
<211> 1251
<212> DNA
<213> 智人
<400> 23
gcccattgtt tttgtaatct ctgaggagaa gcagcagcaa acatttgcta gtcagacaag 60
tgacagggaa tggattccaa acaccagtgt gtaaagctaa atgatggcca cttcatgcct 120
gtattgggat ttggcaccta tgcacctcca gaggttccga gaagtaaagc tttggaggtc 180
acaaaattag caatagaagc tgggttccgc catatagatt ctgctcattt atacaataat 240
gaggagcagg ttggactggc catccgaagc aagattgcag atggcagtgt gaagagagaa 300
gacatattct acacttcaaa gctttggtcc acttttcatc gaccagagtt ggtccgacca 360
gccttggaaa actcactgaa gaaagctcaa ttggactatg ttgacctcta tcttattcat 420
tctccaatgt ctctaaagcc aggtgaggaa ctttcaccaa cagatgaaaa tggaaaagta 480
atatttgaca tagtggatct ctgtaccacc tgggaggcca tggagaagtg taaggatgca 540
ggattggcca agtccattgg ggtgtcaaac ttcaaccgca ggcagctgga gatgatcctc 600
aacaagccag gactcaagta caagcctgtc tgcaaccagg tagaatgtca tccgtatttc 660
aaccggagta aattgctaga tttctgcaag tcgaaagata ttgttctggt tgcctatagt 720
gctctgggat ctcaacgaga caaacgatgg gtggacccga actccccggt gctcttggag 780
gacccagtcc tttgtgcctt ggcaaaaaag cacaagcgaa ccccagccct gattgccctg 840
cgctaccagc tgcagcgtgg ggttgtggtc ctggccaaga gctacaatga gcagcgcatc 900
agacagaacg tgcaggtttt tgagttccag ttgactgcag aggacatgaa agccatagat 960
ggcctagaca gaaatctcca ctattttaac agtgatagtt ttgctagcca ccctaattat 1020
ccatattcag atgaatatta acatggaggg ctttgcctga tgtctaccag aagccctgtg 1080
tgtggatggt gacgcagagg acgtctctat gccggtgact ggacatatca cctctactta 1140
aatccgtcct gtttagcgac ttcagtcaac tacagctgag tccataggcc agaaagacaa 1200
taaattttta tcattttgaa ataaaaaaaa aaaaaaaaaa aaaaaaaaaa a 1251
<210> 24
<211> 886
<212> DNA
<213> 智人
<400> 24
ctcgcaggct ccaggggcgg ggcgtggccg gggcgcagcg acgggcgcgg aggtccggcc 60
gggcgcgcgc gcccccgcca cacgcacgcc gggcgtgcca gtttataaag ggagagagca 120
agcagcgagt cttgaagctc tgtttggtgc tttggatcca tttccatcgg tccttacagc 180
cgctcgtcag actccagcag ccaagatggt gaagcagatc gagagcaaga ctgcttttca 240
ggaagccttg gacgctgcag gtgataaact tgtagtagtt gacttctcag ccacgtggtg 300
tgggccttgc aaaatgatca agcctttctt tcattccctc tctgaaaagt attccaacgt 360
gatattcctt gaagtagatg tggatgactg tcaggatgtt gcttcagagt gtgaagtcaa 420
atgcatgcca acattccagt tttttaagaa gggacaaaag gtgggtgaat tttctggagc 480
caataaggaa aagcttgaag ccaccattaa tgaattagtc taatcatgtt ttctgaaaat 540
ataaccagcc attggctatt taaaacttgt aattttttta atttacaaaa atataaaata 600
tgaagacata aacccagttg ccatctgcgt gacaataaaa cattaatgct aacacttttt 660
aaaaccgtct catgtctgaa tagctttcaa aataaatgtg aaatggtcat ttaatgtatt 720
ttcctatatt ctcaatcact ttttagtaac cttgtaggcc actgattatt ttaagatttt 780
aaaaattatt attgctacct taatgtattg ctacaaaaat ctcttgttgg gggcaatgca 840
ggtaataaag tagtatgttg ttatttgtaa aaaaaaaaaa aaaaaa 886
<210> 25
<211> 1944
<212> DNA
<213> 智人
<400> 25
atcagctttg caagcaagta agggagcgga aaaggccggg aaaggccctg ccgcgagcac 60
gctgccaaga gcccccagca gcagttcggc ttaggactcg ggttgcggcg ggtgtcacct 120
tctcaggggc tagcaaggca gccagggccc aggcgtctga gtgaggggcg ggagaggagg 180
cgaggcagaa agtggacctt ccagcggaaa ggccattttc cccaaggccg agcccaggga 240
agtcccttcc tatagaattc aggcagggtg ggaggcaggg cgcgctcgtg cccctcagcc 300
agctgcaggt gctctctgtc cccaggcgcc atgagcaaga tcagcgaggc cgtgaagcgc 360
gcccgcgccg ccttcagctc gggcaggacc cgtccgctgc agttccggat ccagcagctg 420
gaggcgctgc agcgcctgat ccaggagcag gagcaggagc tggtgggcgc gctggccgca 480
gacctgcaca agaatgaatg gaacgcctac tatgaggagg tggtgtacgt cctagaggag 540
atcgagtaca tgatccagaa gctccctgag tgggccgcgg atgagcccgt ggagaagacg 600
ccccagactc agcaggacga gctctacatc cactcggagc cactgggcgt ggtcctcgtc 660
attggcacct ggaactaccc cttcaacctc accatccagc ccatggtggg cgccatcgct 720
gcagggaact cagtggtcct caagccctcg gagctgagtg agaacatggc gagcctgctg 780
gctaccatca tcccccagta cctggacaag gatctgtacc cagtaatcaa tgggggtgtc 840
cctgagacca cggagctgct caaggagagg ttcgaccata tcctgtacac gggcagcacg 900
ggggtgggga agatcatcat gacggctgct gccaagcacc tgacccctgt cacgctggag 960
ctgggaggga agagtccctg ctacgtggac aagaactgtg acctggacgt ggcctgccga 1020
cgcatcgcct gggggaaatt catgaacagt ggccagacct gcgtggcccc tgactacatc 1080
ctctgtgacc cctcgatcca gaaccaaatt gtggagaagc tcaagaagtc actgaaagag 1140
ttctacgggg aagatgctaa gaaatcccgg gactatggaa gaatcattag tgcccggcac 1200
ttccagaggg tgatgggcct gattgagggc cagaaggtgg cttatggggg caccggggat 1260
gccgccactc gctacatagc ccccaccatc ctcacggacg tggaccccca gtccccggtg 1320
atgcaagagg agatcttcgg gcctgtgctg cccatcgtgt gcgtgcgcag cctggaggag 1380
gccatccagt tcatcaacca gcgtgagaag cccctggccc tctacatgtt ctccagcaac 1440
gacaaggtga ttaagaagat gattgcagag acatccagtg gtggggtggc ggccaacgat 1500
gtcatcgtcc acatcacctt gcactctctg cccttcgggg gcgtggggaa cagcggcatg 1560
ggatcctacc atggcaagaa gagcttcgag actttctctc accgccgctc ttgcctggtg 1620
aggcctctga tgaatgatga aggcctgaag gtcagatacc ccccgagccc ggccaagatg 1680
acccagcact gaggaggggt tgctccgcct ggcctggcca tactgtgtcc catcggagtg 1740
cggaccaccc tcactggctc tcctggccct gggagaatcg ctcctgcagc cccagcccag 1800
ccccactcct ctgctgacct gctgacctgt gcacacccca ctcccacatg ggcccaggcc 1860
tcaccattcc aagtctccac ccctttctag accaataaag agacgaatac aattttctaa 1920
ctcagcaaaa aaaaaaaaaa aaaa 1944
<210> 26
<211> 2474
<212> DNA
<213> 智人
<400> 26
aaaggcgggg cgggcggctg ccaagccggc caataggcgg ctctccggct gctaagccga 60
gagggcaggg gcgccgtcag tagcaccacc gccttccaag tttccccttg tggatgcgcg 120
gccccgcggc tctgctcctc ccggcgcaga ggggccggga gaggccacag gagcggacct 180
ggcacgggat ttctgaggaa cgggagaaga ctggcgcccg acccgctctg gagggtcggt 240
gaacgatgaa gggccggcgg cggcgacgcc gagagtactg caagttcgcg ctgctgttgg 300
tgctgtacac gctggtgctg ttgctcgtcc cctccgtatt ggacggcggc cgcgacgggg 360
acaagggcgc cgagcactgc cccggcctgc agcgcagcct gggagtgtgg agcctggagg 420
cggcggcggc cggcgaacgc gagcagggag cggaggcgcg ggccgccgag gaagggggcg 480
cgaaccagtc tcctcggttc ccaagcaacc tcagcggcgc tgtcggggag gcagtgtctc 540
gcgagaagca gcacatctac gtgcatgcca cctggcgcac cggctcgtcc ttcctgggcg 600
aactctttaa ccagcacccg gacgttttct acttgtatga gcccatgtgg catctatggc 660
aggcgctgta tccgggcgac gccgagagct tgcagggcgc gctgcgcgac atgctgcgtt 720
cgctcttccg ctgcgacttc tccgtgctgc ggctgtacgc gccgccgggg gaccccgctg 780
cgcgcgcccc ggacacggcc aatcttacca cggccgccct cttccgctgg cggactaaca 840
aggtcatctg ctcgccgcca ctgtgtcctg gcgcaccccg tgcccgggcc gaggtgggcc 900
tcgtcgagga caccgcctgc gagcgcagct gcccacccgt ggcgatacgc gccctggagg 960
ccgagtgccg aaagtacccg gtggtggtca tcaaggacgt gcgcctgctc gatctgggcg 1020
tgctggtgcc cctgttgcgt gatccaggcc tcaacctgaa ggtggtgcag cttttccgcg 1080
acccgagggc ggtgcacaac tcgcgcctca agtctaggca gggactgctg cgcgagagca 1140
tccaggtgct gcgcacccgc cagaggggcg accgcttcca ccgtgtgctg ctggcgcacg 1200
gcgtgggtgc tcgccccggg ggccagtctc gcgcgctgcc cgccgcgccg cgcgccgatt 1260
tcttcctgac cggtgcgctc gaggtgatct gcgaagcctg gctgcgcgat ctgcttttcg 1320
cgcgcggcgc gcccgcctgg ctgcggcgcc gctacctgag gctgcgctat gaggacctgg 1380
tgcggcagcc acgcgcccag ctgcgccgcc tgctgcgctt ctccgggcta cgcgcgctcg 1440
cagcgctcga tgccttcgcg ctcaacatga ctcgcggcgc ggcctacggc gccgaccggc 1500
ccttccacct gtcagcgcgc gacgcccggg aggcggtgca cgcctggcgc gagcgcctga 1560
gccgagagca ggtgcgccag gtggaggccg cctgcgctcc agccatgcgt ctgctcgcct 1620
accctcgcag cggagaggag ggcgacgcgg agcagcccag ggaaggggag acgccgctgg 1680
agatggatgc cgacggcgcc acgtagcctc ccatccctgt ccccggcacg gatccgggtc 1740
agtcaccacg aacaggggca ctcggcatgc tgccccagca ctggagaagc agcgctgtgg 1800
gggcaatctg tcacactctc agagtctggg acttgacttg ctaccaacaa ctgctgtgca 1860
attctgctga gcaggaatat catgagctgt tcaataatga cggacgcatt ggttgagatg 1920
aagtttccag taaggaagtg acagtgcaat gtggatattt atggctgtaa aataggaaga 1980
gctttagttc ccaggctgaa cctgccactg ctggagccat ttcaacaagg catcctcaca 2040
acaaagaaga gatgtgattt ggtaccattt cacaccagca ggtgtctgga cgaaaacatc 2100
aatgtgaata agggccaagt gcagtcctgt cttgattaaa ttacttaata atattattaa 2160
ataataatag gtctgggcag tattgttttt aacctgactc atccagctgt ccttcaaata 2220
gctccgtctc cctctaccca gaactgattt ttaaaaagaa gtaatttttc tccctgggct 2280
gggaaaaccc taatgaactg aaacacactt ttactttaaa atttttctgt ctggcgtttt 2340
tgtaatcata ctattaaatg actctggagt catgttaatg acaggatttg ttttgtttgg 2400
atgcagttca attgcatggt ttgggtaaaa gctagcctac atacaaagga atatgaagac 2460
tgtggaagaa actg 2474
<210> 27
<211> 6236
<212> DNA
<213> 智人
<400> 27
tcctctgcgt cccgccccgg gagtggctgc gaggctaggc gagccgggaa agggggcgcc 60
gcccagcccc gagccccgcg ccccgtgccc cgagcccgga gccccctgcc cgccgcggca 120
ccatgcgcgc cgagccggcg tgaccggctc cgcccgcggc cgccccgcag ctagcccggc 180
gctctcgccg gccacacgga gcggcgcccg ggagctatga gccatgaagc cgcccggcag 240
cagctcgcgg cagccgcccc tggcgggctg cagccttgcc ggcgcttcct gcggccccca 300
acgcggcccc gccggctcgg tgcctgccag cgccccggcc cgcacgccgc cctgccgcct 360
gcttctcgtc cttctcctgc tgcctccgct cgccgcctcg tcccggcccc gcgcctgggg 420
ggctgctgcg cccagcgctc cgcattggaa tgaaactgca gaaaaaaatt tgggagtcct 480
ggcagatgaa gacaatacat tgcaacagaa tagcagcagt aatatcagtt acagcaatgc 540
aatgcagaaa gaaatcacac tgccttcaag actcatatat tacatcaacc aagactcgga 600
aagcccttat cacgttcttg acacaaaggc aagacaccag caaaaacata ataaggctgt 660
ccatctggcc caggcaagct tccagattga agccttcggc tccaaattca ttcttgacct 720
catactgaac aatggtttgt tgtcttctga ttatgtggag attcactacg aaaatgggaa 780
accacagtac tctaagggtg gagagcactg ttactaccat ggaagcatca gaggcgtcaa 840
agactccaag gtggctctgt caacctgcaa tggacttcat ggcatgtttg aagatgatac 900
cttcgtgtat atgatagagc cactagagct ggttcatgat gagaaaagca caggtcgacc 960
acatataatc cagaaaacct tggcaggaca gtattctaag caaatgaaga atctcactat 1020
ggaaagaggt gaccagtggc cctttctctc tgaattacag tggttgaaaa gaaggaagag 1080
agcagtgaat ccatcacgtg gtatatttga agaaatgaaa tatttggaac ttatgattgt 1140
taatgatcac aaaacgtata agaagcatcg ctcttctcat gcacatacca acaactttgc 1200
aaagtccgtg gtcaaccttg tggattctat ttacaaggag cagctcaaca ccagggttgt 1260
cctggtggct gtagagacct ggactgagaa ggatcagatt gacatcacca ccaaccctgt 1320
gcagatgctc catgagttct caaaataccg gcagcgcatt aagcagcatg ctgatgctgt 1380
gcacctcatc tcgcgggtga catttcacta taagagaagc agtctgagtt actttggagg 1440
tgtctgttct cgcacaagag gagttggtgt gaatgagtat ggtcttccaa tggcagtggc 1500
acaagtatta tcgcagagcc tggctcaaaa ccttggaatc caatgggaac cttctagcag 1560
aaagccaaaa tgtgactgca cagaatcctg gggtggctgc atcatggagg aaacaggggt 1620
gtcccattct cgaaaatttt caaagtgcag cattttggag tatagagact ttttacagag 1680
aggaggtgga gcctgccttt tcaacaggcc aacaaagcta tttgagccca cggaatgtgg 1740
aaatggatac gtggaagctg gggaggagtg tgattgtggt tttcatgtgg aatgctatgg 1800
attatgctgt aagaaatgtt ccctctccaa cggggctcac tgcagcgacg ggccctgctg 1860
taacaatacc tcatgtcttt ttcagccacg agggtatgaa tgccgggatg ctgtgaacga 1920
gtgtgatatt actgaatatt gtactggaga ctctggtcag tgcccaccaa atcttcataa 1980
gcaagacgga tatgcatgca atcaaaatca gggccgctgc tacaatggcg agtgcaagac 2040
cagagacaac cagtgtcagt acatctgggg aacaaaggct gcagggtctg acaagttctg 2100
ctatgaaaag ctgaatacag aaggcactga gaagggaaac tgcgggaagg atggagaccg 2160
gtggattcag tgcagcaaac atgatgtgtt ctgtggattc ttactctgta ccaatcttac 2220
tcgagctcca cgtattggtc aacttcaggg tgagatcatt ccaacttcct tctaccatca 2280
aggccgggtg attgactgca gtggtgccca tgtagtttta gatgatgata cggatgtggg 2340
ctatgtagaa gatggaacgc catgtggccc gtctatgatg tgtttagatc ggaagtgcct 2400
acaaattcaa gccctaaata tgagcagctg tccactcgat tccaagggta aagtctgttc 2460
gggccatggg gtgtgtagta atgaagccac ctgcatttgt gatttcacct gggcagggac 2520
agattgcagt atccgggatc cagttaggaa ccttcacccc cccaaggatg aaggacccaa 2580
gggtcctagt gccaccaatc tcataatagg ctccatcgct ggtgccatcc tggtagcagc 2640
tattgtcctt gggggcacag gctggggatt taaaaatgtc aagaagagaa ggttcgatcc 2700
tactcagcaa ggccccatct gaatcagctg cgctggatgg acaccgcctt gcactgttgg 2760
attctgggta tgacatactc gcagcagtgt tactggaact attaagtttg taaacaaaac 2820
ctttgggtgg taatgactac ggagctaaag ttggggtgac aaggatgggg taaaagaaaa 2880
ctgtctcttt tggaaataat gtcaaagaac acctttcacc acctgtcagt aaacggggga 2940
gggggcaaaa gaccatgcta taaaaagaac tgttccagaa tctttttttt ccctaatgga 3000
cgaaggaaca acacacacac aaaaattaaa tgcaataaag gaatcattaa aaaaaatagt 3060
aaatgatttt ttttccctca gcctgctggc acttaatatc ttctaaatga tttggcatga 3120
tttttttttc tttactaccg atgacaaact ccagtggcat gaagatctaa ttttcaaaag 3180
ggtaaaaact gcatggcata tatacaacaa gctagcaagc caattctcag caaaacctgc 3240
aacagaattc ctaaagtgaa gatgacagat gaacacaaag aagctgcctg ggcctcttca 3300
cttaaacatg tccccacacc ccatcctctc ggagccccac ttcttacccc ccacctccca 3360
ccctctataa tccccactcc ccattggaga ccaggccagg gcagaactcc acggaccttg 3420
ctcttgttga ttcactttcc ccattgtgtt ttctcctgga ctgagcatcc tttggaaatg 3480
ggagctggaa tttgaacaat gatgctattg tatagttctt ttataaatgt aaatatggaa 3540
ataagagatt ttgacacatc attttcactt gtctgtattg agatattttc cttgtaaagg 3600
ttctctgtaa acttgagttg attttttgct ccccatcttt tttgtttctt gtctctcttt 3660
ctctgtctct gtccttctct cttgtaacgt gttatacaat gactcttggg cttgcttaaa 3720
aagacagata tagccacaga tgcagggagt ttgggcacaa aacacgtgca gtttaaagtt 3780
ggtgtgcgtt aaaccaaaaa taaaaggggg gacataaaca acaaaataac ccatatcaaa 3840
gacacaaaat tatgtaaatg gaaatatatg tactaagttt cgaaaatttt ttgatgtcat 3900
tataaaccta tgtaaataat gtaagaaagt agacaccctt tcagattaat cacaaaagtg 3960
ccaagctcat gattttggtt ttcggttttg acaattttct ttccctgtct ttaatgtgaa 4020
aggaggataa acttaaagcc ttaaataaaa aaattttttt aaatgttaaa agcttggaaa 4080
aaattaagct ttccatttta tttgtatttg ttagtgtcaa tatttcatcc atgctcattt 4140
tcctgcctca aaatatatat ggtagaaccc tattggaaaa gtggtaatgg gaatagaagg 4200
agcagttacc tttgtatccg cattgttaaa ataggctttt atgctgtgct gtgctttcaa 4260
gaaaccttgt ttgacctctg gcattttact gatcagtgga ccgttgcact ggattataat 4320
gggattctac tatatacaaa tccacattgt tcttctccct ccagccagat ttgcagatgt 4380
aatctgggct ttccaagtcc ctctgagttt ccttcacttt tactgatttt tttcttctaa 4440
atatggtcaa gatagcttct gtcacatgtt aagtaaataa gctgaagaaa tttggtcccg 4500
gctttgtttt aatgtacaaa ccggtatgtg atcacttcag tgagcatccc tctatagatg 4560
ggctttagta aagactgtcc caaagagccc ctacttctct aatgcccccc cccttttttt 4620
tttaggaaaa gaacatgcag ttttactcat cacttcttca tgacaccaaa tccattgcta 4680
ggtttagctc ctggtccctt ttcagcaaga ttcatgttat ccgtcttaca actttgattt 4740
tggaaagtat tatgtcctaa aaatgcactg cttaacacag tggggttttt ttcccccgag 4800
gtgtctttaa ctggggaagt accacaaaca tagagcagag actttaattt ctatattcta 4860
caatagacca tcaccaaaca tcttatcatg ttgttgcttt ctgagtaata ggtgctacgc 4920
aggtaggcgg gctttctcta ggactaggtg tacgtttatt ttgtaataac agggctatct 4980
acaaggcctc tcagccttac tcctggcttc ataggacaca ggtagcatcc ctctagtcat 5040
tggcaatggc tctttcagct cggaggaagc ttggaggaaa ctcagattac ttggtatctt 5100
ttcctgttgc tgcattgctt agtgtttcct tgttgctggg tcctactctc tagtagatac 5160
taaactgctg tgaagtacac catacacatt tcactaagat tccagagcca ccttggtgac 5220
ataacagaaa caaaatcatg ttggttacaa aacaaattaa atctctattg ttaactttta 5280
agcatttcac aaacaacatt gtaaatgtgc gatgttacgt tttaaatcag accacagtgg 5340
tccccaaata ttatgtacat atggcaaatg tcagtgtaac tttttgttac actggcaatt 5400
tcataggtaa tcgaacctat gctccaatgt taaattattt gtgtatatgt aaaatacaca 5460
agctttaagc tatgtgtgta tgaatatgaa agttaatgca accatatcaa ttgtaaaaat 5520
ggattataat tatttttgat ggtattaggt tatgtagttt caaactcttt gctgtatttt 5580
gttttgcacc tgccattcat ttgctaattt ttgtggcgtg gagattcttt tttattaatt 5640
tgagctcaca gcacaagtgt atcactgttt aatgttaccc aacaagagtt agtgttaagt 5700
gatgatcaag ttcccatttc acctgctcta cttttgctgc attaattaat gacacccgga 5760
tgaggagacg tgcgctaact tcattgctca tctgggatag tgcatgagcc cattgaatta 5820
gagctgctcc tactagataa ctgagcagta cacataagtg catgttatga aacatgaatc 5880
acatagagca gtggagtttt accaagtggt gtgtgtggtt tttgtttttt actatgcaaa 5940
gatgggaaat gcacaaactt ttcaaagact agtgtctgaa gaactttaca aacaatactt 6000
gaaccctttc tttaaagtta tcccatcatg ttttatagtc attgttgctt ccattgttag 6060
tttccatttt caagtgcttt gtaatttttt aagtgcacta cctgaaattt tgtttgaaat 6120
taataaattc attcgtatct tgttggctgc ctatgaatgg agattcagta gtcattgtat 6180
gcatctttaa gtcaaatgtg tattaaaact ttcgttaacg tagaaaaaaa aaaaaa 6236
<210> 28
<211> 3127
<212> DNA
<213> 智人
<400> 28
gcccagttgg agccagacag cggggtggac aagtggcgtg tgtgctgcga ccccgaggga 60
agatgaacgg gacgcggaac tggtgtaccc tggtggacgt gcacccagag gaccaggcgg 120
cgggcagcgt ggacattctc aggctgactc tccagggtga actgacagga gatgaacttg 180
aacacatagc ccagaaggcg ggcaggaaga cctatgccat ggtgtccagc cactcagctg 240
gtcattctct ggcttcagaa ctggtggagt cccatgatgg acatgaggag atcattaagg 300
tgtacttgaa ggggaggtct ggagacaaga tgattcacga gaagaatatt aaccagctga 360
agagtgaggt ccagtacatc caggaggcca ggaactgcct acagaagctc cgggaggata 420
taagtagcaa gcttgacagg aacctaggag attctctcca tcgacaggag atacaggtgg 480
tgctagaaaa gccaaatggc tttagtcaga gtcccacagc cctgtacagc agcccacctg 540
aggtggacac ctgtataaat gaggatgttg agagcttgag gaagacggtg caggacttgc 600
tggccaagct tcaggaggcc aagcggcaac accagtcaga ctgtgtggct tttgaggtca 660
cactcagccg gtaccagagg gaagcagaac aaagtaatgt ggcccttcag agagaggagg 720
acagagtgga gcagaaagag gcagaagtcg gagagctgca gaggcgcttg ctagggatgg 780
agacggagca tcaggcctta ctggcgaaag tgagggaagg ggaggtggcc ctagaggaac 840
ttcggagcaa caatgctgac tgccaagcag aacgagaaaa ggctgctacc ctggaaaagg 900
aagtggccgg gttgcgggag aagatccacc acttggatga catgctcaag agccagcagc 960
ggaaagtccg gcaaatgata gagcagctcc agaattcaaa agctgtgatc cagtcaaagg 1020
acgccaccat ccaggagctc aaggagaaaa tcgcctatct ggaggcagag aatttagaga 1080
tgcatgaccg gatggaacac ctgatagaaa aacaaatcag tcatggcaac ttcagcaccc 1140
aggcccgggc caagacagag aacccgggca gtattaggat atccaagccg cctagcccga 1200
agcccatgcc tgtcatccga gtggtggaaa cctgagctgc ctggagatgg ttgctgccat 1260
tgctgctgcc tctgcctcgg agaagcccac tgcccctgtt ggctgttaac actgcctttg 1320
acttcctgac tgtcccctgg ctgcacccag gacttcgggc tcctgtgtct caccattccc 1380
aagcccctgg ccactctaag ctgggcagac ggagcacgag cacctattca aggcactgca 1440
gccctttgga agacattgtc ctgcaagcag gagccagggc aatatctata ttcctacagt 1500
gactattttt ctctgtagag agcctccctt ctgttgtaga ctggactctg gctgtgccat 1560
aagccaggcc ttcatcagat tgggagaggt gacaagattt gcctcagccc taaaagctgg 1620
agacacagat gtccagagtg attggagaat gtcctggggg aatgaagttc cttccacaaa 1680
cacagctcag ttcttagcaa caaactgttt gtttttctac ttgctccatc tgcagcctac 1740
gctgccctgg cctcctgcag acagatagtg gggttacctg gcaaggcctg gtgagagcca 1800
gtgaacctaa gctttgactg ggtggccttg tctttctggg gaggagggaa tgtacattca 1860
gggagtagcc ttttgcggaa aaattctcta gggctacaga cagtcatgtg tgacttctct 1920
ctgctgtgaa aactcccaga gtctctttag ggattttccc taaggtgtac caccaggcac 1980
acctcagtct tcttgaccca gagcctgaaa actgttttca ctgggttcca ccagtcccag 2040
caaaatcctc tttgtattta ttttgctaag ttattggtgg ttttgcttac atctcatgat 2100
tgatataata ccaaagttct atagccttct cttgcagtat ttggatttgc ttgaaaccgg 2160
gaaaactgtt cccattaggc ttgttaatgt cagagtgaca ctattatgaa tctttctctc 2220
cctttcctct gcctgtttct tctctctttc tccttcaaac ttgctctgca gctaaggaag 2280
gtgagtctac tttccctgag gctttggggt cagagtatat gttgtttgga gaaagagggc 2340
aatcaggact cttctgggac ccagatgagt tcttcactag cccttctgaa ccccttgctc 2400
cataattggt cttttatcct ggctctgaat gaccctgcag gtcatcatgg ttttcttttt 2460
ttattgtttt tttttttttc tgagacagag tctcactctg tcacccaggc tggagtgcag 2520
tggcgcgatc tcagctcact gcaacctctg cctcccggat ttaagcgatt cttctgcctc 2580
agcctcccga gtagctggga ctacaggtgt gccaccacgc ctggctgatt tttgtatttt 2640
tagtagagat ggggtttcac catactggct aggctggtct cgaattcctg acctcaggtg 2700
atccacccac ctcggcttcc caaagtgcta ggattatagg cttgagctac tgcgcccggc 2760
ccatggtgtt tttctttagg gctcttccta caaccttgag aagtagatag gcatcagagt 2820
atggtactat aggaatcaga aaaattcaaa acaaatgtgg attaagtgtt taggctctat 2880
gtggctcacg cagccagaat ccttaagtct gtgtgtttct gtgtctcaag actgggctca 2940
cattctggct ttgtccataa caatgctctg ggatttcagg gagttccctc atttgtaaaa 3000
tgagggggtc agagcaggtg atatccatgt ttcttccctt tctgatattg ttgtctgtgg 3060
catattcttt gtatggcgaa tttaataaat tatattaatg tgtctctttg aaaaaaaaaa 3120
aaaaaaa 3127
<210> 29
<211> 3473
<212> DNA
<213> 智人
<400> 29
ctcgccagcg gtccgcaggg ctggagaccc acgccgtgga gaggaccagc ctcaggtcgc 60
cccgcctggg cccgcgcccc gacctcgctg cccccgcctc gcctctctgc ccgtggcgct 120
tacggccacc ttggcctcgg gggcagggca tgggcggccc ccgccagatc gcccagcgcc 180
agtactaact gccctcgctc tggccttcga gcccgaagcc tcttctgcgc gcacaaccta 240
ggcagtaatc ctaaactagc gggcaccaca gaccagctgc agccacccca acccagggat 300
cacttccgga cccctcgacc gcccggcacc agcgcgcaag ggacccttca gccggagacc 360
agagtccagt cccggtcacg aggccaccgc cgctgcccgc ctcgagaagc accacgcggg 420
ctgagccgtc ggctagcggg tcactcccga gcctctgtct gcaccgcgcc agccccagac 480
cacggacgct gagcctccag cgcgtgccag cctgggccgc tgggctctcg gggccagccc 540
gcgacgatcc cctgagctct ccgcagaagg gccgagcgtc cgttccgggg acgccaggcc 600
cgcccccgcc ccccgacagc cgcggggatc cagagcccgg gggtgcggga cgcccgcgcc 660
atgactgccg agagcgggcc gccgccgccg cagccggagg tgctggctac cgtgaaggaa 720
gagcgcggcg agacggcagc aggggccggg gtcccagggg aggccacggg ccgcggggcg 780
ggcgggcggc gccgcaagcg ccccctgcag cgcgggaagc cgccctacag ctacatcgcg 840
ctcatcgcca tggccatcgc gcacgcgccc gagcgccgcc tcacgctggg cggcatctac 900
aagttcatca ccgagcgctt ccccttctac cgcgacaacc ccaaaaagtg gcagaacagc 960
atccgccaca acctcacact caacgactgc ttcctcaaga tcccgcgcga ggccggccgc 1020
ccgggtaagg gcaactactg ggcgcttgac cccaacgcgg aggacatgtt cgagagcggc 1080
agcttcctgc gccgccgcaa gcgcttcaag cgctcggacc tctccaccta cccggcttac 1140
atgcacgacg cggcggctgc cgcagccgcc gccgccgccg ccgccgccgc cgccgccatc 1200
ttcccaggcg cggtgcccgc cgcgcgcccc ccctacccgg gcgccgtcta tgcaggctac 1260
gcgccgccgt cgctggccgc gccgcctcca gtctactacc ccgcggcgtc gcccggccct 1320
tgccgcgtct tcggcctggt tcctgagcgg ccgctcagcc cagagctggg gcccgcaccg 1380
tcggggcccg gcggctcttg cgcctttgcc tccgccggcg cccccgctac caccaccggc 1440
taccagcccg caggctgcac cggggcccgg ccggccaacc cctccgccta tgcggctgcc 1500
tacgcgggcc ccgacggcgc gtacccgcag ggcgccggca gtgcgatctt tgccgctgct 1560
ggccgcctgg cgggacccgc ttcgccccca gcgggcggca gcagtggcgg cgtggagacc 1620
acggtggact tctacgggcg cacgtcgccc ggccagttcg gagcgctggg agcctgctac 1680
aaccctggcg ggcagctcgg aggggccagt gcaggcgcct accatgctcg ccatgctgcc 1740
gcttatcccg gtgggataga tcggttcgtg tccgccatgt gagccagcgt agggacgaaa 1800
actcatagac acatcggctg ttcacacgtt ccccgcaatc tgagaacgaa caggaatgga 1860
gagaggactc aactgggacc cacgtggaaa agaccgagca ggccacagag gctcggtctc 1920
cccgcgcaca gcgtaggcac ccggtgtact ctgtaaacgg gaggaggtgg ggcgaggcag 1980
ccagagccct tggactggca cagggaccct cgatggagcg aagccctcaa acgggatgct 2040
ttctggtatt ctatcgggga gggtccttgg cggtaaccag agggcagcgt agtgtcaaca 2100
ccagagacca ggatccaaat tgtggggaat cagtttcagc cttccatgtg ctgccggaac 2160
tcgggccttt ttacgcggtt cgtcctctag tgcctttaac tgcgttacta caataaaagg 2220
ctgcggcagc gcctttcttc ttaaagtgag gaggacaaat ttgcaaaaga aataggcttt 2280
tcttcttttt taaattggag aaatctctgc tctggttgac ctgggctggt tttccctgtc 2340
tctgagaact tgagacctag ctccgagttg aactgtgcgt cagcactcca gtcccatcac 2400
ctgaaccttc agtctccccc atctgttaca ctagagggct gcaggactct atccaccgcc 2460
cccgggttat cattcagggc cccatcatct tggatgctgc cctgcgtatt tggcagcaat 2520
ggtgggccac ccagggcctc tgagtagcca cccaaagcct agccgctgtt ctagggaacg 2580
gaaaagagtt catggccaag cgtctaacct aaagtcccag gattggctcc aggcagcaat 2640
tatatcataa cttattgaac ttttgagcag gacgtgctgg taatttcatg gctgttactg 2700
cccagtcata aatctgcttt tccattataa ggcagagaga agtacattcg ttcatttgtc 2760
cactgtttct tgtcatcacg cagccctgga cccaaagggt gaactaaagt ttaaggagat 2820
gagaggattc aaggagcccg ttggtgacgc ctttcagtag ctggggaggg ctcttccatc 2880
cccagcaccc cctgctacac ctcagcagcc tcccccatgc aaaaaggaaa gagaaaaatt 2940
aagttagggc agtcagtaaa gtgagcttta gaaagaaact ggaattttaa cttcattttg 3000
tatcttgctt aagtagcagg ctcactaaaa ttagagaaag tccaataact ctcccccttt 3060
cccttgagaa atctttaagt ttcgattctg gagcaaaaac tttcagcatt aaatatttca 3120
gaggctccat tcacagcttt cagataaact ggagtgttca gatggactgt tttaataaaa 3180
atctttgagc aagtgagtta tggcaagaga aactcagcct ctttctgtat aaacttaaca 3240
gggaagggct ggggtgtgaa aaagaagatt gtatgaaaac cattggtaat ttttattttt 3300
tatttttggg actgcactat cctgttcacg aagacatgtg aacttggttc agtccaaatg 3360
gggatttgta taaaccagtg ctctccatta gaaatatggt gcaagccaca tatgtaattt 3420
taaatattct agtagccaca ttaataaagt aaaaagaaac aaaaaaaaaa aaa 3473
<210> 30
<211> 3823
<212> DNA
<213> 智人
<400> 30
agtcctcccc cggcgcctcc gactggcagt gggactcagc gggcgtggag gtcgcggctg 60
agcgagcgag ccctgggcga gtgaattgtg gctgtgggtt gacggtggag acaccccccg 120
gagggaggcg gagggaaggg aggcgaggcc tgcacctgca tgcttcccgc ctcccactcc 180
ccagcgcccc cggaccgtgc agttctctgc aggaccaggc catggagctc gaagtccggc 240
gggtccgaca ggcgttcctg tccggccggt cgcgacctct gcggtttcgg ctgcagcagc 300
tggaggccct gcggaggatg gtgcaggagc gcgagaagga tatcctgacg gccatcgccg 360
ccgacctgtg caagagtgaa ttcaatgtgt acagtcagga agtcattact gtccttgggg 420
aaattgattt tatgcttgag aatcttcctg aatgggttac tgctaaacca gttaagaaga 480
acgtgctcac catgctggat gaggcctata ttcagccaca gcctctggga gtggtgctga 540
taatcggagc ttggaattac cccttcgttc tcaccattca gccactgata ggagccatcg 600
ctgcaggaaa tgctgtgatt ataaagcctt ctgaactgag tgaaaataca gccaagatct 660
tggcaaagct tctccctcag tatttagacc aggatctcta tattgttatt aatggtggtg 720
ttgaggaaac cacggagctc ctgaagcagc gatttgacca cattttctat acgggaaaca 780
ctgcggttgg caaaattgtc atggaagctg ctgccaagca tctgacccct gtgactcttg 840
aactgggagg gaaaagtcca tgttatattg ataaagattg tgacctggac attgtttgca 900
gacgcataac ctggggaaaa tacatgaatt gtggccaaac ctgcattgca cccgactata 960
ttctctgtga agcatccctc caaaatcaaa ttgtatggaa gattaaggaa acagtgaagg 1020
aattttatgg agaaaatata aaagagtctc ctgattatga aaggatcatc aatcttcgtc 1080
attttaagag gatactaagt ttgcttgaag gacaaaagat agcttttggt ggggagactg 1140
atgaggccac acgctacata gccccaacag tacttaccga tgttgatcct aaaaccaagg 1200
tgatgcaaga agaaattttt ggaccaattc ttccaatagt gcctgtgaaa aatgtagatg 1260
aggccataaa tttcataaat gaacgtgaaa agcctctggc tctttatgta ttttcgcata 1320
accataagct catcaaacgg atgattgatg agacatccag tggaggtgtc acaggcaatg 1380
acgtcattat gcacttcacg ctcaactctt tcccatttgg aggagtgggt tccagtggga 1440
tgggagctta tcacggaaaa catagttttg atactttttc tcatcagcgt ccctgtttat 1500
taaaaagttt aaagagagaa ggtgctaaca aactcagata tcctcccaac agccagtcaa 1560
aggtggattg gggaaaattt tttctcttga aacggttcaa caaagaaaaa ctcggtctcc 1620
tgttgctcac tttcctgggt attgtagccg ctgtgcttgt caagaaatac caagctgtgc 1680
tgaggagaaa ggccctgttg atttttctgg tagttcacag actgcgttgg tccagtaagc 1740
agagatgaac accagatttc aaaacccagc cctgtctgtt aagagtgagg cagaatatta 1800
ctgaagaatg atcctgttca acctcctagt gcctctactg aattattcct cttttaaatg 1860
gttaatgaac caataatttt taaatcatac caaaaatagt aagaaaatat gcaaacactc 1920
tgtgatcaaa cttaaaagtc attgccattc atcattaata aaagttgcca tttcaactac 1980
gtcccaacat tccctaatag ggtattcagg gaacctgtct taaattgtgc ttatctaaat 2040
cttggaactt tgagctaggg gaggagaatg tattagacta aatacaaact gcggggttgt 2100
aagggagtct cagaacctca ctgaatcctt cactccagtt aatggcactg ctcacttcct 2160
gcctctgctg ccaccatcac tgtgtgaagc tttcaagagc ttggtacttc ccagggctac 2220
cggcagtcct ctgtagtcca gagaggtgag attagatctt cttggttccc tgtgaggttt 2280
caggcactaa aactctatgt ggggaaggga ggggttactc ctcctccaat gggactcaag 2340
gacttgacct ccaggagtag gcccctggtc agaagtgcca tctcaccagt ggtcttcatt 2400
cttcctcatt cattctttat catcctgtgt tctgtttagt tgcaacaatc tcttgtgact 2460
aatgtcactc aaagcatctt gtaaatccta gggcttcctg gaagttagtt gccaaagtca 2520
tgcaagcatc acctgtcatt cttgtgttgg agttatagaa ttctacatct tataaaacct 2580
aactggcatt taaaaaatac tgtggccggg cgtggtggct catgcctgta atcccagcac 2640
tttgggaggc cgaggtggga ggattgcttg agtccaggaa tttgagacca gcctggacaa 2700
cacagtgaga cctcatctct atcaaaaaat aaaaattagc tagatgtggt ggcatgagcc 2760
tgtgttccca gctgcttagg aggctgaagc aggaggattg attgagcctg cgaggccaag 2820
gctgcagcag gctgtgattg caccactgca cttcagcttg ggcaacagag caagaccctg 2880
tctccgaaac aaataaaaaa tactgtaata aaagtactta taaacatact aatcctcttt 2940
caggacccta aagttgcagg ttagtaggtc ttcaaggaca aatctgtaag tttcttattt 3000
ctgtagtgca agtaaaattt cactttttga aactatagag agatcccttt ctgattagcc 3060
tacagaactt aaagtgaggg aaccatttcc tctcacagac aaagaggcct gggatattag 3120
gactttgggg tttgagagca tcatggggca gacagatggt ggatggtctg gacaagaagc 3180
gagtaagcca ctgcggttgg tcatactgaa gggaattgat ggcaagagga tcccctgagc 3240
aagtcagaag ttactctcat cagtcgttca tggtcacaac ctgaggtact ctgctgagtg 3300
ggcaaggctg aagaagaggc ctgtggaatg cagcattacc tgctggacag agcagggcag 3360
gcagttctat gccttggagc tcctgactgc agggactctg tccccacact caaaaagact 3420
cagctcactc aatgagagaa tgtgatttac tttatagaac gtataatcaa ctttgttgaa 3480
taatttgttc tattaaggct gtctaaagta tgtgatgtct tcatcatagt atgaagtgtt 3540
gaaaattaat aacgagccta gtttaggaaa aagctgctta aaactgtggc tctaagagag 3600
taatcataaa ataccttaga taaaattgca ctatggaatt ttcattgagt atgtttaaat 3660
tattggcttg tctactaata cacatctgct tcaaaatgaa catatttcat aaaattggca 3720
tcaattttaa tgacgctcct ggtatggaac ctcagatata ccctattgga gacaatcctt 3780
tgatcataaa ttctccccaa ctataaatca ttttatgtct tta 3823
<210> 31
<211> 3873
<212> DNA
<213> 智人
<400> 31
catctgcctg cccttctgcc atccgagcgc cctgactgcg ccacactgca ggccatggag 60
aatgagctgc cagtcccaca tacatctagc agtgcctgtg ccaccagcag taccagcggg 120
gccagtagca gcagtggctg caacaacagc agcagtggtg gaagtggccg ccccaccggg 180
ccccagattt ctgtgtacag tggtattcca gaccggcaga ccgtgcaggt gatccagcag 240
gccctgcaca gacagcccag cacggccgct cagtacctgc agcagatgta cgccgcccag 300
cagcagcacc tcatgctgca gaccgcggcg ctccagcagc agcacctcag cagcgcccag 360
ctccagagcc tggcagccgt acagcaggca agcctggtat ccaatagaca aggaagcact 420
tcaggcagca atgtgtctgc gcaggccccg gcccagtcat cttcgatcaa cctggcagcc 480
tccccagcag cagcccagct cctcaaccgg gcccagagtg tgaactctgc agcagcctca 540
ggcatcgctc agcaggctgt gctcttgggc aacacgtctt ccccagccct gactgcaagc 600
caagcacaga tgtatctgag ggcacagatg ctcatcttca cgcccacggc caccgtcgct 660
actgtgcagc ctgagctcgg cactggctcc cccgcccggc cccccacccc cgcccaggta 720
cagaacttga ccctccgaac acagcagaca ccagcggcag cagcctcggg ccccaccccc 780
actcagcctg tcctgcccag cttggccctg aaacccacgc cgggcggtag ccagcctctg 840
cctaccccag cacagagcag aaatactgct caggcttccc ctgcaggtgc caagcctggc 900
atagctgaca gtgtgatgga gccacacaag aaaggagatg gcaacagcag tgtgccaggg 960
agcatggaag gccgggctgg gctcagccgg acggttcctg ctgtggctgc ccaccccctc 1020
attgcaccag cctatgctca gctgcagcca caccagctcc tcccacagcc atcctcaaag 1080
cacctgcagc cccaatttgt gatccagcag cagccacagc cacaacagca gcagccgccg 1140
ccccagcagt cacggcctgt gctccaagct gagccccacc cccagctcgc ctcagtctct 1200
ccaagcgtgg ccctccagcc cagctcagag gcccatgcca tgccactagg cccggttaca 1260
cccgccctgc cactccagtg tcccactgcc aacctgcaca agcctggcgg cagtcagcag 1320
tgtcaccctc ccacacctga tactgggcct cagaatggac atcccgaggg cgtgccccac 1380
acccctcaac gcaggttcca gcacacttca gctgtcatct tacaactgca gcctgcttca 1440
ccaccccagc agtgtgtccc tgatgactgg aaagaagtgg caccagggga gaaaagtgtg 1500
cctgagacgc ggtctggccc atcaccacat cagcaggcta ttgtcactgc catgcctggt 1560
ggcctgcctg tacccacgag ccctaacatc cagccgtccc cagctcacga gacagggcag 1620
ggcattgttc atgcactgac cgacctcagc agccccggca tgacctcagg gaacggaaac 1680
tctgcctcca gcatcgccgg cactgccccc cagaatggtg agaataaacc accacaggcc 1740
attgtgaaac cccaaatcct gacgcatgtt atcgaagggt ttgtgatcca ggagggggcg 1800
gagcctttcc cggtgggacg ctcgtccctg ctggtgggga atctcaagaa gaagtatgca 1860
caggggttcc tgcctgagaa acttccacag caggatcaca ccaccaccac tgactcggag 1920
atggaggagc cctatctgca agaatccaaa gaggagggtg ctcccctcaa actcaagtgt 1980
gagctctgtg gccgggtgga ctttgcctat aagttcaagc gttccaagcg cttctgttcc 2040
atggcttgtg caaagaggta caacgtggga tgcaccaaac gggtgggact tttccactca 2100
gaccggagca agctgcagaa ggcaggagct gcgacccaca accgccgtcg ggccagcaaa 2160
gccagtctgc caccacttac caaggatacc aagaagcagc caacaggcac tgtgcccctt 2220
tcggttactg ctgctttgca gctaacacac agccaggaag actccagccg ttgctcagat 2280
aactcaagct atgaggaacc cttgtcaccc atctcagcca gctcatctac ttcccgccgg 2340
cgacaaggcc agcgggacct ggagctcccc gacatgcata tgcgggacct ggtgggcatg 2400
ggacaccact tcctgccaag tgagcccacc aagtggaatg tagaagacgt ctacgaattc 2460
atccgctctc tgccaggctg ccaggagata gcagaggaat tccgtgccca ggaaatcgac 2520
gggcaagccc tgctgctgct caaggaggac cacctgatga gcgccatgaa catcaagctg 2580
gggcccgccc tgaagatcta cgcccgcatc agcatgctca aggactccta gggctggtgg 2640
cagccaggat tctggcccag ggcgcctcct cccgactgag cagagccaga cagacattcc 2700
tgaggggccc agaaatgggg ccggttggag ggcaggggct ctccctaggg gcatagctgg 2760
tgaggaggtc tgggcacctc ctccatggct ctcaggggcc tttcatttct gtgggagggg 2820
cagagaggta ggtggcacag aagatggggc tttatgcttg taaatattga tagcactggc 2880
ttcctccaaa gtcccaatac tctagccccg ctctcttccc ctctttctgt cccccatttt 2940
ccagggggta tatggtcagg gctccccaac ctgagttggg ttacttcaag ggcagccagc 3000
aggcctggat ggaggcctag aaagcccttg ccttccttcc tcccacttct ttctccaggc 3060
ctggttaact cttccgttgt cagcttctcc cccttcagcc tgtttctgca gcagccaggg 3120
ttctcccccc tacaccctct gcaggtggag agagagaagc tgggcccagc cgggccgtgc 3180
ctgctggcac agacgcctta acgctgtgtg tatgactgtg tgactgtgtg ggagcctgga 3240
ctgacagata ggccaagggc tactctctgg catctccagg tgttttgtag caaacagcca 3300
cttagtgctt tgtcctggac tccactcagc ctcaggatgg ggaatagcca agaatggcag 3360
cctcagcgca gaggcaaggt cagaaagaga cggcgcttca gagtttcctt tccagacacc 3420
cctccccgca ctgtgaagtt cccctgaccg ccctcctggt tcacaaagag cattaagaaa 3480
gctgcggtgg tctgagcaac atagcccaaa gggctgagcc tcctggcctg cctgcccgcc 3540
caccctggga gtcccagtgg tgaggctcag agaactgcta aggggaaaga acagctggag 3600
tttctgttga tgtgaagaag gcagctcttg gcctcccact cccacacttc tttgcctata 3660
aatcttccta gcagcaattt gagctacctg aggaggaggc agggcagaaa gggcgagggc 3720
ctgcctctga cctgccgtgt cctttgcagg aaggaggtag gcacctttct gagcttattc 3780
tattccccac ccacaccccc aggcagggtt ggaaatgaag gactttttta acctttgttt 3840
tgttttttaa aaataaatct gtaaaatctg tct 3873
<210> 32
<211> 2904
<212> DNA
<213> 智人
<400> 32
ggagagcccc ggcgcggagc aggcgggtag ggcgaagggt cccctttcgg gcgccatggg 60
gcgccgagcg cggcctggcc cctcgggctc ctctgcgggg agggcaggcc gcaggctgga 120
gcggggtgcg gaggctggcg gggagcggcc cccggaggct ttcctggtag aagttgatgc 180
gaggaagggc ggcggggacc aggggacggt attcagaatt cgagcgcagg agctccgctt 240
ctccacctgc tcccggggag ctattgggat ccagagaatc acccgctgat ggtttttgcc 300
caggcctgaa acaaccagag agctacggga aaggaagggc ttggcttgcc agaggaattt 360
tccaagtgct caaacgccag gcttacggcg cctgtgatcc gtccaggagg acaaagtggg 420
atttgaagat ccactccact tctgctcatg gcgggccagg gcctgcccct gcacgtggcc 480
acactgctga ctgggctgct ggaatgcctg ggctttgctg gcgtcctctt tggctggcct 540
tcactagtgt ttgtcttcaa gaatgaagat tactttaagg atctgtgtgg accagatgct 600
gggccgattg gcaatgccac agggcaggct gactgcaaag cccaggatga gaggttctca 660
ctcatcttca ccctggggtc cttcatgaac aacttcatga cattccccac tggctacatc 720
tttgaccggt tcaagaccac cgtggcacgc ctcatagcca tatttttcta caccaccgcc 780
acactcatca tagccttcac ctctgcaggc tcagccgtgc tgctcttcct ggccatgcca 840
atgctcacca ttgggggaat cctgtttctc atcaccaacc tgcagattgg gaacctattt 900
ggccaacacc gttcgaccat catcactctg tacaatggag catttgactc ttcctcggca 960
gtcttcctta ttattaagct tctttatgaa aaaggcatca gcctcagggc ctccttcatc 1020
ttcatctctg tctgcagtac ctggcatgta gcacgcactt tcctcctgat gccccggggg 1080
cacatcccat acccactgcc ccccaactac agctatggcc tgtgccctgg gaatggcacc 1140
acaaaggaag agaaggaaac agctgagcat gaaaacaggg agctacagtc aaaggagttc 1200
ctttcagcga aggaagagac cccaggggca gggcagaagc aggaactccg ctccttctgg 1260
agctacgctt tctctcggcg ctttgcctgg cacctggtgt ggctgtctgt gatacagttg 1320
tggcactacc tcttcattgg cactctcaac tccttgctga ccaacatggc cggtggggac 1380
atggcacgag tcagcaccta cacaaatgcc tttgccttca ctcagttcgg agtgctgtgt 1440
gccccctgga atggcctgct catggaccgg cttaaacaga agtaccagaa ggaagcaaga 1500
aagacaggtt cctccacttt ggcggtggcc ctctgctcga cggtgccttc gctggccctg 1560
acatccctgc tgtgcctggg cttcgccctc tgtgcctcag tccccatcct ccctctccag 1620
tacctcacct tcatcctgca agtgatcagc cgctccttcc tctatgggag caacgcggcc 1680
ttcctcaccc ttgctttccc ttcagagcac tttggcaagc tctttgggct ggtgatggcc 1740
ttgtcggctg tggtgtctct gctccagttc cccatcttca ccctcatcaa aggctccctt 1800
cagaatgacc cattttacgt gaatgtgatg ttcatgcttg ccattcttct gacattcttc 1860
cacccctttc tggtatatcg ggaatgccgt acttggaaag aaagtccctc tgcaattgca 1920
tagttcagaa gccctcactt ttcagccccg aggatggttt tgttcatctt ccaccacctt 1980
tgaggacctc gtgtcccaaa agactttgcc tatcccagca aaacacacac acacacacac 2040
acacacacaa aataaagaca cacaaggacg tctgcgcagc aagaaaagaa tctcagttgc 2100
caagcagatt gatatcacac agactcaaag caaaggcatg tggaacttct ttatttcaaa 2160
acagaagtgt ctccttgcac ttagccttgg cagacccttg actccagggg agatgacctg 2220
ggggaggaag tgtgtcaact atttctttag gcctgtttgg ctccgaagcc tatatgtgcc 2280
tggatcctct gccacgggtt aaattttcag gtgaagagtg aggttgtcat ggcctcagct 2340
atgcttcctg gctctccctc aagagtgcag ccttggctag agaactcaca gctctgggaa 2400
aaagaggagc agacagggtt ccctgggccc agtctcagcc cagccactga tgctggatga 2460
ccttggcctg accctggtct ggtctcagaa tcacttttcc catctgtaaa attgagatga 2520
attttggtgt tgaaagttct tcctggagca gatgtcctag aaggttttag gaatagtgac 2580
agagtcaggc caccccaagg gccatgggag ccagctgacc tgcttgaccg aaggatttct 2640
gacagactat ctttggggat gttttcaaga agggatataa gttatttact ttgggcattt 2700
aaaagaaaat ttctctcggg aataatttta tagaaaaata aagcttctgt gtctaaggca 2760
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2820
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2880
aaaaaaaaaa aaaaaaaaaa aaaa 2904
<210> 33
<211> 1797
<212> DNA
<213> 智人
<400> 33
ttggccgcga gctggcggcg tggggggcgg gcccgggccg ggccggggcg gggaaggaag 60
gtggcggcgg cccggcgcgg ggggaggggg gtgctgaccc ggatgttcac tcctgggcac 120
ccggggaagt ggaagcgccg ggccctgctg cgggggggag agccactgac gccgggaccg 180
ggaccgccgc cgccgccgcc accatgagtg atcagcagct ggactgtgcc ttggacctaa 240
tgaggcgcct gcctccccag caaatcgaga aaaacctcag cgacctgatc gacctggtcc 300
ccagtctatg tgaggatctc ctgtcttctg ttgaccagcc actgaaaatt gccagagaca 360
aggtggtggg aaaggattac cttttgtgtg actacaacag agatggggac tcctataggt 420
caccatggag taacaagtat gaccctccct tggaggatgg ggccatgccg tcagctcggc 480
tgagaaagct ggaggtggaa gccaacaatg cctttgacca gtatcgagac ctgtattttg 540
aaggtggcgt ctcatctgtc tacctctggg atctggatca tggctttgct ggagtgatcc 600
tcataaagaa ggctggagat ggatcaaaga agatcaaagg ctgctgggat tccatccacg 660
tggtagaagt gcaggagaaa tccagcggtc gcaccgccca ttacaagttg acctccacgg 720
tgatgctgtg gctgcagacc aacaaatctg gctctggcac catgaacctc ggaggcagcc 780
ttaccagaca gatggagaag gatgaaactg tgagtgactg ctccccacac atagccaaca 840
tcgggcgcct ggtagaggac atggaaaata aaatcagaag tacgctgaac gagatctact 900
ttggaaaaac aaaggatatc gtcaatgggc tgaggtctgt gcagactttt gcagacaaat 960
caaaacaaga agctctgaag aatgacctgg tggaggcttt gaagagaaag cagcaatgct 1020
aaacctctgt ttcatgctaa ccagacacgc cgtgcactcg ttagattcct ttcttagaaa 1080
actcgttttc tgctcccttc cctcgtccct tccctccccg acaggtcaca taacagctgc 1140
atcattgacc gcacagcgcc atctctccct gagaataaag ccgatagcca ccctcctccg 1200
gctccgagcc tgcttctgcc acacctcgct ctcagttctc tccacatttc catagagacc 1260
gtgtggtttt tgttcacccg ggccccccgt cttcctccct gtccccccat ttataggcat 1320
aaaatccact gtctgccagc ctcccttccc tcccaccttt ttggtacatt ggtgtaaaaa 1380
atgtaaaaca aaaaaatttt atgaactaac tgtggtgtgt gaaagagaga agaaaaactg 1440
gaaatcttat tccgtgtgtg tttgggagtt gcttggggtt gggggtcgtg gggacagggg 1500
acagctctgg gagcagaggt ggccctcggt gccgtcctgc gcagactctc ccgtcccacg 1560
gaggccgcgg ggtgggggct ggggggggtg ccgccgaccg ttccgctctt ccggccaggt 1620
gcttttctgt caatttctat ggaatgcaaa aggaggtttt tgttttattt tgtttttttg 1680
taaagcttaa gaaaaaaatc tacatcttat acttgagcct ccatacttaa aaaaagaaaa 1740
gaaaagaaat caataaaaag aaactggggc gcagttagca aaaaaaaaaa aaaaaaa 1797
<210> 34
<211> 5617
<212> DNA
<213> 智人
<400> 34
tataaaaaaa gtactgaaga cattttcccc gcacaactgc taaagctcca gagacacgag 60
cgtgtgtggc agcaagagcc gccagttcgg gaccaccgca gctggggtgg cagcggcgca 120
ggaggggtcg cggggaggga gtggtgagcg caggcggcag gggtctggga aagacgaagt 180
cgctatttgc tgtctgagcg cgctcgcagc tcctggaagt gttgccgcct ctcggtttcg 240
ctctcgctcg ctgcgctcct agaaggggcg gccgcctcca ggactgacca gggccaagtg 300
gcgctcggcg ggcactacat ggcggagggt gaagggtact tcgccatgtc tgaggacgag 360
ctggcctgca gcccctacat ccccctaggc ggcgacttcg gcggcggcga cttcggcggc 420
ggcgacttcg gcggcggcga cttcggcggt ggcggcagct tcggtgggca ttgcttggac 480
tattgcgaaa gccctacggc gcactgcaat gtgctgaact gggagcaagt gcagcggctg 540
gacggcatcc tgagcgagac cattccgatt cacgggcgcg gcaacttccc cacgctcgag 600
ctgcagccga gcctgatcgt gaaggtggtg cggcggcgcc tggccgagaa gcgcattggc 660
gtccgcgacg tgcgcctcaa cggctcggca gccagccatg tcctgcacca ggacagcggc 720
ctgggctaca aggacctgga cctcatcttc tgcgccgacc tgcgcgggga aggggagttt 780
cagactgtga aggacgtcgt gctggactgc ctgttggact tcttacccga gggggtgaac 840
aaagagaaga tcacaccact cacgctcaag gaagcttatg tgcagaaaat ggttaaagtg 900
tgcaatgact ctgaccgatg gagtcttata tccctgtcaa acaacagtgg caaaaatgtg 960
gaactgaaat ttgtggattc cctccggagg cagtttgaat tcagtgtaga ttcttttcaa 1020
atcaaattag actctcttct gctcttttat gaatgttcag agaacccaat gactgagaca 1080
tttcacccca caataatcgg ggagagcgtc tatggcgatt tccaggaagc ctttgatcac 1140
ctttgtaaca agatcattgc caccaggaac ccagaggaaa tccgaggggg aggcctgctt 1200
aagtactgca acctcttggt gaggggcttt aggcccgcct ctgatgaaat caagaccctt 1260
caaaggtata tgtgttccag gtttttcatc gacttctcag acattggaga gcagcagaga 1320
aaactggagt cctatttgca gaaccacttt gtgggattgg aagaccgcaa gtatgagtat 1380
ctcatgaccc ttcatggagt ggtaaatgag agcacagtgt gcctgatggg acatgaaaga 1440
agacagactt taaaccttat caccatgctg gctatccggg tgttagctga ccaaaatgtc 1500
attcctaatg tggctaatgt cacttgctat taccagccag ccccctatgt agcagatgcc 1560
aactttagca attactacat tgcacaggtt cagccagtat tcacgtgcca gcaacagacc 1620
tactccactt ggctaccctg caattaagaa tcatttaaaa atgtcctgtg gggaagccat 1680
ttcagacaag acaggagaga aaaaaaaaaa aaagaaaaaa aaaagagtga tccagccctt 1740
attagggatg tgttttgtgc aatgatgata tgctcctggt tttaagtttg gcaaagctta 1800
tgtatctttt aatagatgtg ggagcatgat ctcgaaagga tccttttccc ttctcttatt 1860
ctcctaccca attggattct atcctgcaaa aaaagagaga cctgtcatta gaagcaacca 1920
ggttctcctg atacaagaga agaaatgtgt gatgacaata tgggtttgct gtatctgctc 1980
ccatagcttt gccataggaa aaaaaaaagt ggaaagtttc ttttaagatg gaattcataa 2040
aagggaaaat acggaggaaa aaaggtctca ctccaacttg tgaatcagtt taggagttca 2100
gatattaata gtaacaatac aggaaaaagg ggaactccaa cgttgggatt actgtctgag 2160
gcttgtagca agtgctttct gtggaatgat cttgttttgc taacaaacgg cttgctccaa 2220
atgaacagta gtaggttggt gcagttctcg taacaatcag cagaacttat gatgacacaa 2280
tccattaatt ccagctgcgt gcatagatca catttttaaa atgtaaaaat gcaagcaaaa 2340
acagctgtaa caaagaaagt gtgctcaagg accaaagatt taacagataa aaatacccaa 2400
ttagaagaga tatagtagac tatatgaaga gagattatat ttgttacaca ccaatataca 2460
tcaaagtgcc tgttgccttc tgaaaatttg aagtggcaaa attattttat ggtttaatga 2520
ttattttatt ttatcaggga ctgcctcaag aagaaaataa cataagcttg tgaatggtgg 2580
agaaaatgcc ctattttttc ttgcaaatac ttgtataaag ttaacatttg ttgatctgat 2640
attatcatag gtacatgtgt atgtgtgtat aaattatatg tgtgtgtgta tatatacatt 2700
ttatatatac attttatatg tatatataca cagtagattg actatgatct agaataatgt 2760
ctcaaatagg aaatgtttaa atactgtgtg tttttatgtt ttcaacagga taacatgaga 2820
cgtgggcata ttgcaatgat gaattaaatc cacatctaaa aaaattaaat gaaggaggga 2880
accaagtaat atatttcata ggaagagcag aaattatact gttttagtgg gatttttttt 2940
tctttttttt tttttctttg gtgagccata aaattccaca aatgggagaa tatttgtttg 3000
gcagagcact cttttttata ttgaactgcc attttgacag ttggaaccca tttattaaaa 3060
aaaaaattgc attcctctat gatgtttaat ctagtggatc atggatcagt aataggctac 3120
ttaaatccct gactgctaaa aaggatttcc ggtgatctaa acactacttg ctaatgttta 3180
aatgaatttt aatgaatgca ttctgcattt ctggaccact agaatttagt aatgtgaaat 3240
gacccttttt acagaatatt tgcacaattg cttaaaattt atatatgaga tatatattat 3300
atataacatt ttataaatca tgtcaatatg aaacatcttt gatctggttg tcacactgca 3360
tttaaatatt tagtactgta ctttaaatcg ctttccatta aatcaaatcc aactttattt 3420
tctttcttac aaaaatacca gttatacctt tgtgaaatga actggcatta ctatttcagt 3480
tcaataacag ctaatcctaa aaccaccctt tctcctagcc agtagttcct ctagatactg 3540
gtctctgaaa atgcatttgt taaaaacaaa acaaaactaa cacataagaa ccttcccttt 3600
gtgttgtgaa acaaccacat aatctccaca accttagtgg atgactgctt gctatgataa 3660
ttcctcgaag acccaattag aagattttca tcatcagtta aagagagacc acgggagaaa 3720
aaaatatcct cctgttggca gtataatttg tttgtttgtt tatctaggga tcctcagatg 3780
cttagtgcta ggttaatcca ggttaatccg tctggactac cttttgtgca tctttctttg 3840
aagccttaat gggaacctga tgggtttgct gtagcagctt ccttgtgaat tctgtcagag 3900
ctgcaacagc cgctgcactg ccactcagtt ttctaaggaa ctcctcctac taccatcttg 3960
gctcagtctc cctcacttaa gccctgggtt tgaaaaatta attgcaactt cccaggaaac 4020
attgttcagt ttgcagatta agcctggcac tcacctatca gaaaccagag ctccgcctgc 4080
ttagttgttt caaagttttc tgaaagaaaa ctaggggagc acttgtgaac acaggagcag 4140
ctggtgatct gctttcttac cctaactctt gacaaatgag tcgtctacta ttttaaagag 4200
tctggaggtc tctgactctg ccataacaat aacctgctgt taatttataa cacagatttt 4260
tgtttggaag agccttattt gaaatacact ttgatttatt ttcttaaata tttatattct 4320
tttcttgctt acttcagggt tggtagctta gttggaagtg ccagcacctg gcacctattc 4380
atatagaaca ggctgtactc aagacaactt ctagcattta ctttaagact tatataattt 4440
atttctattt tgtgtgtact atagtcttgt gcatatgtag ttgaacacac agtgaaatat 4500
atgtctctct ttgtggatgt gcggcctaaa aatttgaatg tctggtgaga gagagccatg 4560
tgtataggtc agagaaaaga acagctcccg actccctatt agcgcctgtg atttgtttcc 4620
ttttgtgttt atctggccta gtgtgctgtt tctttaaacc aggaagaagt tttgtctttt 4680
ggaggctctt ctcacctgtc cagcctggca tgtcagagaa cacatagcct gtgacaatgc 4740
cgtttttaaa ggtttactta atttgcagta aatccagctg cctcaagaac tcctacacca 4800
agatggacat ttcctttcca gaaatgggat caagtatctg ctcactttgg tattggatgg 4860
actaataatg tagctccaaa aatgcaagga tggaagaata tgtgtaatcc aaaccaagga 4920
aggaaatgaa aagtgaacgt actgttttta ccaccccttt ctgtttgctt attgttggtt 4980
gcttcactgt gcataaagtt gttttcaatg caacgcttgt taaataaata ttgtgaacta 5040
ttttgtaaat gaaatgtatt atgttgaaag ctgtcagttc aaaaataagc ttttttgttg 5100
ttgttgaaga tgaagtgtgt taggtgaaac caaaaagcca aaaaaagtaa tttcatatat 5160
agcatctatt tgaatataat ctttctttaa aatttctttt agcatagcat tttcagtgct 5220
aagaaagaat ctctatgtta tattttgtta aaataatggc tttctaacaa agcaaatggt 5280
aaagtacaaa gttggaagat gtcaagttaa cgagacttgc tgcaaagcct tgcagaacgg 5340
aggaggctct gcctgctggc tgtctctccc tccaacctct ctacaatcat gcctgctttg 5400
aggtgttctg ttgcagcaag ctgcaccttg ggtcactctt ttggaatatt ttgactatag 5460
gctgcgtcac aggcagaaaa ggagttgatg gaaaatggac taaaaaactg acatgtttga 5520
atcagtgcta gagggaacag attgtgaatt ttgtttacag catccaatat ttggattttt 5580
ttgtaaataa aaaagttatt tttttctatt gaaaaaa 5617
<210> 35
<211> 3939
<212> DNA
<213> 智人
<400> 35
gcggcggcgg gagctggttc cggctgcgcg cgcagcggtg gtggtggcgg cgcgatcggc 60
cgggctgtaa ccgtcgtctg tccgggagcg gctggagcgg cagcggcggc cgggcacggc 120
gcgaggtgac gccacagggc agcggcggca gcggaggcag cggcggcagc aggagacgca 180
gcggcggccg cagcagcagc agcaagacgg actcgtggag acgcgccgcc gccgccgccg 240
ccgggccggg ccgggtgtcg cgcgccgagg ctggggggga gtcgtcgccg ccgccgccac 300
cgctaccgcc gccgccgccg ccgccgaggt gactgaggag agaggcgcct cctcgctccc 360
gccaccgccg gacttcaatg cccagtcccc agctcgccag cgtttttcgt tggaatatac 420
gttgcacatt tatggcgatt ctgagtgtga gggcagactt ctgccaggct cagcacagca 480
ttttcgctga caagtgagct tggaggttct atgtgccata attaacattg ccttgaagac 540
tcctggacac cgagactggc ctcagaaata gttggctttt ttttttttta attgcaagca 600
tatttctttt aatgactcca gtaaaattaa gcatcaagta aacaagtgga aagtgaccta 660
cacttttaac ttgtctcact agtgcctaaa tgtagtaaag gctgcttaag ttttgtatgt 720
agttggattt tttggagtcc gaaggtatcc atctgcagaa attgaggccc aaattgaatt 780
tggattcaag tggattctaa atactttgct tatcttgaag agagaagctt cataaggaat 840
aaacaagttg aatagagaaa acactgattg ataataggca ttttagtggt ctttttaatg 900
ttttctgctg tgaaacattt caagatttat tgattttttt ttttcacttt ccccatcaca 960
ctcacacgca cgctcacact ttttatttgc cataatgaac cgtccagccc ctgtggagat 1020
ctcctatgag aacatgcgtt ttctgataac tcacaaccct accaatgcta ctctcaacaa 1080
gttcacagag gaacttaaga agtatggagt gacgactttg gttcgagttt gtgatgctac 1140
atatgataaa gctccagttg aaaaagaagg aatccacgtt ctagattggc catttgatga 1200
tggagctcca ccccctaatc agatagtaga tgattggtta aacctgttaa aaaccaaatt 1260
tcgtgaagag ccaggttgct gtgttgcagt gcattgtgtt gcaggattgg gaagggcacc 1320
tgtgctggtt gcacttgctt tgattgaatg tggaatgaag tacgaagatg cagttcagtt 1380
tataagacaa aaaagaaggg gagcgttcaa ttccaaacag ctgctttatt tggagaaata 1440
ccgacctaag atgcgattac gcttcagaga taccaatggg cattgctgtg ttcagtagaa 1500
ggaaatgtaa acgaaggctg acttgattgt gccatttaga gggaactctt ggtacctgga 1560
aatgtgaatc tggaatatta cctgtgtcat caaagtagtg atggattcag tactcctcaa 1620
ccactctcct aatgattgga acaaaagcaa acaaaaaaga aatctctcta taaaatgaat 1680
aaaatgttta agaaaagaga aagagaaaag gaattaattc agtgaaggat gattttgctc 1740
ctagttttgg agtttgaatt tctgccagga ttgaattatt ttgaaatctc ctgtcttttt 1800
aaactttttc aaaataggtc tctaaggaaa accagcagaa cattagcctg tgcaaaacca 1860
tctgtttggg gagcacactc ttccattatg cttggcacat agatctccct gtggtgggat 1920
tttttttttc cctttttttg tgggggaggg ttggtggtat atttttcccc tcttttttcc 1980
ttcctctcct acatctccct tttcccccga tccaagttgt agatggaata gaagcccttg 2040
ttgctgtaga tgtgcgtgca gtctggcagc cttaagccca cctgggcact tttagataaa 2100
aaaaaaaaaa aaacaaaaaa caacaccaaa aaaacagcag tgatatatat atatatatat 2160
atatatatat atatatatat atatatatat atatatatat atatatataa tataatatat 2220
atatatatat atatattttc caggtggttt ttagtcttta ctgatgaaag ggtgttcatg 2280
ttagtttctt caaaacccta tctaatacta ggcaaagtag ccaagagcct tttgttttgt 2340
ttttattttg ataaattagt ggagaaatgg cattttaaga ggagtctctt ctcaacttac 2400
ctgagagtcg aattcttctc ttccctaacc aatgaagcta agtggttatc ccagaaactt 2460
gtcttctaaa agggaggact ccaggccatc aataaagatg tccaggcagt gagcgtactt 2520
tttacaccct gtagaattgt gggctgtagc gttactctga ttttctgtct agtatcagag 2580
aatgctggta gcttaaaatt tttattttag gacttgtact ctgaattttc aggaaccgtc 2640
aaaggagcag cagcaaattc acatattttc gacttgagaa atgcttgtgg tatgtgtttt 2700
ccaaactgcc ccctatatgt aaagttcagt ttaaccactg attgccttgt tattactagg 2760
ttttttgaga ttaaaaaaaa aaaatccctg gtttaaaacc aacaatgatg cctagtgagt 2820
atgtgtccac aggccataac agggtagaag agagacatcg tgcaacccaa tgagtagtga 2880
agggactgtg ttgcttgtga agcggtgtag tagcattttt gcagattctt ggctgggttt 2940
agtgtactga tctagaaaag ctgtttttct gctcctttgt ggaaggcagt tatgatcagg 3000
ctgcatggac aaagcaggta gaggggcacc atcaggggct cttgcactat tttcacctct 3060
aaatattacg tactcagtag tgccctgctt ctagggctct gaatacgggc ttaaagtcat 3120
cttgtcctgc tggaatttgc tgtgcagagc cataagcctc ccattttgtt agcgtcagct 3180
aggccaatag gaacagaccg ggaccttgtc tcacactgat gatacctcac atgttgaccg 3240
gctatgtgaa ctgcctattt cctatgctgg agttttgatt tttaactaaa cgcaaatctg 3300
tagattctct cctctcccat cccagaaaac aaaacaaaat aatgcttttc gaaattgttt 3360
ctaggacttt aaaacataat ggtatatcca aaattcttta tttcagaatg caacaataga 3420
ttccattaat atagactcaa gatcaaaaca gcatacctgc taagctaaga tagatggtgt 3480
tgattccact gggttttgat caatacaata acaaaccttt ttcctttgac atactctgaa 3540
ttttgttgtt tggggggagg gggtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtatgtgt 3600
gtgtgtgtgt gtgcacgcgc agtgtccatc agtatcagtg cctgcctgag ttaggaaaat 3660
tacattcctg gttctgtatt gaggagaagg atgtataaag caacatgaaa cattagccct 3720
ccttttattt taaagactaa tgttaattgt tcttaaaact ggattttttt tccttaaagc 3780
aatttttttc ttttcgattt aatgaagtat tgctagctga agccagtttg acatagagag 3840
atgtcagatt gatttgaaag gtgtgcagcc tgatttaaaa ccaaaccctg aaccctttta 3900
aagaacaata aaacatattt tacacgctca aaaaaaaaa 3939
<210> 36
<211> 4451
<212> DNA
<213> 智人
<400> 36
gctccgcccc cgcgccgccg gccctagtct gcctgttttc gactcgcgct ccggctgctg 60
tcacttggct ctctggctgg agcttgagga cgcaaggagg gtttgtcact ggcagactcg 120
agactgtagg cactgccatg gcccctgtgc tcagtaagga ctcggcggac atcgagagta 180
tcctggcttt aaatcctcga acacaaactc atgcaactct gtgttccact tcggccaaga 240
aattagacaa gaaacattgg aaaagaaatc ctgataagaa ctgctttaat tgtgagaagc 300
tggagaataa ttttgatgac atcaagcaca cgactcttgg tgagcgagga gctctccgag 360
aagcaatgag atgcctgaaa tgtgcagatg ccccgtgtca gaagagctgt ccaactaatc 420
ttgatattaa atcattcatc acaagtattg caaacaagaa ctattatgga gctgctaaga 480
tgatattttc tgacaaccca cttggtctga cttgtggaat ggtatgtcca acctctgatc 540
tttgtgtagg tggatgcaat ttatatgcca ctgaagaggg acccattaat attggtggat 600
tgcagcaatt tgctactgag gtattcaaag caatgagtat cccacagatc agaaatcctt 660
cgctgcctcc cccagaaaaa atgtctgaag cctattctgc aaagattgct ctttttggtg 720
ctgggcctgc aagtataagt tgtgcttcct ttttggctcg attggggtac tctgacatca 780
ctatatttga aaaacaagaa tatgttggtg gtttaagtac ttctgaaatt cctcagttcc 840
ggctgccgta tgatgtagtg aattttgaga ttgagctaat gaaggacctt ggtgtaaaga 900
taatttgcgg taaaagcctt tcagtgaatg aaatgactct tagcactttg aaagaaaaag 960
gctacaaagc tgctttcatt ggaataggtt tgccagaacc caataaagat gccatcttcc 1020
aaggcctgac gcaggaccag gggttttata catccaaaga ctttttgcca cttgtagcca 1080
aaggcagtaa agcaggaatg tgcgcctgtc actctccatt gccatcgata cggggagtcg 1140
tgattgtact tggagctgga gacactgcct ttgactgtgc aacatctgct ctacgttgtg 1200
gagctcgccg tgtgttcatc gtcttcagaa aaggctttgt taatataaga gctgtccctg 1260
aggagatgga acttgctaag gaagaaaagt gtgaatttct gccattcctg tccccacgga 1320
aggttatagt aaaaggtggg agaattgttg ctatgcagtt tgttcggaca gagcaagatg 1380
aaactggaaa atggaatgaa gatgaagatc agatggtcca tctgaaagcc gatgtggtca 1440
tcagtgcctt tggttcagtt ctgagtgatc ctaaagtaaa agaagccttg agccctataa 1500
aatttaacag atggggtctc ccagaagtag atccagaaac tatgcaaact agtgaagcat 1560
gggtatttgc aggtggtgat gtcgttggtt tggctaacac tacagtggaa tcggtgaatg 1620
atggaaagca agcttcttgg tacattcaca aatacgtaca gtcacaatat ggagcttccg 1680
tttctgccaa gcctgaacta cccctctttt acactcctat tgatctggtg gacattagtg 1740
tagaaatggc cggattgaag tttataaatc cttttggtct tgctagcgca actccagcca 1800
ccagcacatc aatgattcga agagcttttg aagctggatg gggttttgcc ctcaccaaaa 1860
ctttctctct tgataaggac attgtgacaa atgtttcccc cagaatcatc cggggaacca 1920
cctctggccc catgtatggc cctggacaaa gctcctttct gaatattgag ctcatcagtg 1980
agaaaacggc tgcatattgg tgtcaaagtg tcactgaact aaaggctgac tttccagaca 2040
acattgtgat tgctagcatt atgtgcagtt acaataaaaa tgactggacg gaacttgcca 2100
agaagtctga ggattctgga gcagatgccc tggagttaaa tttatcatgt ccacatggca 2160
tgggagaaag aggaatgggc ctggcctgtg ggcaggatcc agagctggtg cggaacatct 2220
gccgctgggt taggcaagct gttcagattc ctttttttgc caagctgacc ccaaatgtca 2280
ctgatattgt gagcatcgca agagctgcaa aggaaggtgg tgccaatggc gttacagcca 2340
ccaacactgt ctcaggtctg atgggattaa aatctgatgg cacaccttgg ccagcagtgg 2400
ggattgcaaa gcgaactaca tatggaggag tgtctgggac agcaatcaga cctattgctt 2460
tgagagctgt gacctccatt gctcgtgctc tgcctggatt tcccattttg gctactggtg 2520
gaattgactc tgctgaaagt ggtcttcagt ttctccatag tggtgcttcc gtcctccagg 2580
tatgcagtgc cattcagaat caggatttca ctgtgatcga agactactgc actggcctca 2640
aagccctgct ttatctgaaa agcattgaag aactacaaga ctgggatgga cagagtccag 2700
ctactgtgag tcaccagaaa gggaaaccag ttccacgtat agctgaactc atggacaaga 2760
aactgccaag ttttggacct tatctggaac agcgcaagaa aatcatagca gaaaacaaga 2820
ttagactgaa agaacaaaat gtagcttttt caccacttaa gagaaactgt tttatcccca 2880
aaaggcctat tcctaccatc aaggatgtaa taggaaaagc actgcagtac cttggaacat 2940
ttggtgaatt gagcaacgta gagcaagttg tggctatgat tgatgaagaa atgtgtatca 3000
actgtggtaa atgctacatg acctgtaatg attctggcta ccaggctata cagtttgatc 3060
cagaaaccca cctgcccacc ataaccgaca cttgtacagg ctgtactctg tgtctcagtg 3120
tttgccctat tgtcgactgc atcaaaatgg tttccaggac aacaccttat gaaccaaaga 3180
gaggcgtacc cttatctgtg aatccggtgt gttaaggtga tttgtgaaac agttgctgtg 3240
aactttcatg tcacctacat atgctgatct tttaaaatca tgatccttgt gttcagctct 3300
ttccaaatta aaacaaatat acattttcta aataaaaata tgtaatttca aaatacattt 3360
gtaagtgtaa aaaatgtctc atgtcaatga ccattcaatt agtggtcata aaatagaata 3420
attcttttct gaggatagta gttaaataac tgtgtggcag ttaattggat gttcactgcc 3480
agttgtctta tgtgaaaaat taactttttt gtggcaatta gtgtgacagt ttccaaattg 3540
ccctatgctg tgctccatat ttgatttcta attgtaagtg aaattaagca ttttgaaaca 3600
aagtactctt taacatacaa gaaaatgtat ccaaggaaac attttatcat taaaaattac 3660
ctttaatttt aatgctgttt ctaagaaaat gtagttagct ccataaagta caaatgaaga 3720
aagtcaaaaa attatttgct atggcaggat aagaaagcct aaaattgagt ttgtagaact 3780
ttattaagta aaatcccctt cgctgaaatt gcttattttt ggtgttggat agaggatagg 3840
gagaatattt actaactaaa taccattcac tactcatgcg tgagatgggt gtacaaactc 3900
atcctctttt aatggcattt ctctttaaac tatgttccta acaaaatgag atgataggat 3960
agatcctggt taccactctt ttgctgtgca catacgggct ctgactggtt ttaatagtca 4020
ccttcatgat tatagcaact aatgtttgaa caaagctcaa agtatgcaat gcttcattat 4080
tcaagaatga aaaatataat gttgataata tatattaagt gtgccaaatc agtttgacta 4140
ctctctgttt tagtgtttat gtttaaaaga aatatatttt ttgttattat tagataatat 4200
ttttgtattt ctctattttc ataatcagta aatagtgtca tataaactca tttatctcct 4260
cttcatggca tcttcaatat gaatctataa gtagtaaatc agaaagtaac aatctatggc 4320
ttatttctat gacaaattca agagctagaa aaataaaatg tttcattatg cacttttaga 4380
aatgcatatt tgccacaaaa cctgtattac tgaataatat caaataaaat atcataaagc 4440
attttaaaaa a 4451
<210> 37
<211> 2753
<212> DNA
<213> 智人
<400> 37
gagcgaccgt cggggccggc tggggccgga gctcggggct cggtgggcct acagcggctc 60
cggacggacc cccggggctg gggagtcggg gaggcctgcc ccggccccct gcccgcggcc 120
gccatggcgg agaattggaa gaactgcttc gaggaggagc tcatctgccc tatctgcctg 180
cacgttttcg tggagccagt gcagctgccg tgcaaacaca acttctgccg gggctgcatc 240
ggcgaggcgt gggccaagga cagcggcctc gtacgctgcc cagagtgcaa ccaggcctac 300
aaccagaagc cgggcctgga gaagaacctg aagctcacca acatcgtgga gaagttcaat 360
gccctgcacg tggagaagcc gccggcggcg ctgcactgcg tgttctgccg ccgcggcccc 420
ccgctgcccg cgcagaaggt ctgcctgcgc tgcgaggcgc cctgctgcca gtcccacgtg 480
cagacgcacc tgcagcagcc ctccaccgcc cgcgggcacc tcctggtgga ggcggacgac 540
gtgcgggcct ggagctgccc gcagcacaac gcctaccgcc tctaccactg cgaggccgag 600
caggtggccg tgtgccagta ctgctgctac tacagcggcg cgcatcaggg acactcggtg 660
tgcgacgtgg agatccgaag gaatgaaatc cggaagatgc tcatgaagca gcaggaccgg 720
ctggaggagc gagagcagga cattgaggac cagctgtaca aactcgagtc agacaagcgc 780
ctggtggagg agaaagtgaa ccaactgaag gaggaagttc ggctgcagta cgagaagctg 840
caccagctgc tggacgagga cctgcggcag acagtggagg tcctagacaa ggcccaggcc 900
aagttctgca gcgagaacgc agcgcaggcg ctgcacctcg gggagcgcat gcaggaggcc 960
aagaagctgc tgggctccct gcagctgctc tttgataaga cggaggatgt cagcttcatg 1020
aagaacacca agtctgtgaa aatcctgatg gacaggaccc agacctgcac gagcagcagc 1080
ctttccccca ctaagatcgg ccacctgaac tccaagctct tcctgaacga agtggccaag 1140
aaggagaagc agctgcggaa aatgctagaa ggccccttca gcacgccggt gcccttcctg 1200
cagagtgtcc ccctgtaccc ttgcggcgtg agcagctctg gggcggaaaa gcgcaagcac 1260
tcaacggcct tcccagaggc cagtttccta gagacgtcgt cgggccctgt gggcggccag 1320
tacggggcgg cgggcacagc cagcggtgag ggccagtctg ggcagcccct ggggccctgc 1380
agctccacgc agcacttggt ggccctgccg ggcggcgccc aaccagtgca ctcaagcccc 1440
gtgttccccc catcgcagta tcccaatggc tccgccgccc agcagcccat gctcccccag 1500
tatggcggcc gcaagattct cgtctgttct gtggacaact gttactgttc ttccgtggcc 1560
aaccatggcg gccaccagcc ctacccccgc tccggccact ttccctggac agtgccctcg 1620
caggagtact cacacccgct cccgcccaca ccctccgtcc cccagtccct tcccagcctg 1680
gcggtcagag actggcttga cgcctcccag cagcccggcc accaggattt ctacagggtg 1740
tatgggcagc cgtccaccaa acactacgtg acgagctaac gccacgcagg cggcggggcg 1800
ctggggaatc ttcctcccca gcccccgggc tcgggagtta tgcatccaga gacctgccct 1860
tctaccttcc tcgcctcccc tcttcctcat tccattgccc caggtctttt ccttttggat 1920
tttgttttgg ttttggcttt gtttttgatt tttttttatt atgaatctcc tggacgcaga 1980
ggtgacagtg ggagctggcc tgggccagga cggcaggtgg ccctggagat gggaaagtgt 2040
ctgtgtcgag gcgctgagct ctctctctgt ttctcctttt ttcctctact ccttcccctt 2100
cacacccccg tggctggaag gaacctcggc ttccctgaaa gcttgggggt cccacccttc 2160
ttaccccacc cgggaggaac gcccagggcc ccgggcttgt ttctcctctt gttttccttt 2220
tgggcagttt gatcactgat cgagtaagga atgaccttta gattgtgcga cttttgtttt 2280
tgttttttta aattttttta aaccaagaat gatttctcct gcttccttct cctcaccatc 2340
ttcccagacg gagttcaaag gccacttctc aagcagcttt tggcaccttc agcctcagag 2400
tggaatcttt taaagacagg acccctatgt ccaggaaagg ggaaaaggaa ctttgccaat 2460
gatagtgacc acagcaaaag caaataataa taatattaat aataataaag agaaataaaa 2520
taataaaata aaaaacaata gcacagccct tgttgaggtc agcagggagg aggggctgcc 2580
cggagttggg tccttgcctg gattttgaca cagcaacttc ctgtagtgag cactttgtat 2640
gaatcgtgga cttcctgttc tcaaggcgca ggtatttatt ctgtatctgt ctagagcaca 2700
caccaaaatc caaccttcta ataaacatga tggcgcagtc ccacaaaaaa aaa 2753
<210> 38
<211> 5346
<212> DNA
<213> 智人
<400> 38
ggggagcagg cgggggagcg ggcgggaagc agtgggagcg cgcgtgcgcg cggccgtgca 60
gcctgggcag tgggtcctgc ctgtgacgcg cggcggcggt cggtcctgcc tgtaacggcg 120
gcggcggctg ctgctccaga cacctgcggc ggcggcggcg accccgcggc gggcgcggag 180
atgtggcccc tggtagcggc gctgttgctg ggctcggcgt gctgcggatc agctcagcta 240
ctatttaata aaacaaaatc tgtagaattc acgttttgta atgacactgt cgtcattcca 300
tgctttgtta ctaatatgga ggcacaaaac actactgaag tatacgtaaa gtggaaattt 360
aaaggaagag atatttacac ctttgatgga gctctaaaca agtccactgt ccccactgac 420
tttagtagtg caaaaattga agtctcacaa ttactaaaag gagatgcctc tttgaagatg 480
gataagagtg atgctgtctc acacacagga aactacactt gtgaagtaac agaattaacc 540
agagaaggtg aaacgatcat cgagctaaaa tatcgtgttg tttcatggtt ttctccaaat 600
gaaaatattc ttattgttat tttcccaatt tttgctatac tcctgttctg gggacagttt 660
ggtattaaaa cacttaaata tagatccggt ggtatggatg agaaaacaat tgctttactt 720
gttgctggac tagtgatcac tgtcattgtc attgttggag ccattctttt cgtcccaggt 780
gaatattcat taaagaatgc tactggcctt ggtttaattg tgacttctac agggatatta 840
atattacttc actactatgt gtttagtaca gcgattggat taacctcctt cgtcattgcc 900
atattggtta ttcaggtgat agcctatatc ctcgctgtgg ttggactgag tctctgtatt 960
gcggcgtgta taccaatgca tggccctctt ctgatttcag gtttgagtat cttagctcta 1020
gcacaattac ttggactagt ttatatgaaa tttgtggctt ccaatcagaa gactatacaa 1080
cctcctagga aagctgtaga ggaacccctt aatgcattca aagaatcaaa aggaatgatg 1140
aatgatgaat aactgaagtg aagtgatgga ctccgatttg gagagtagta agacgtgaaa 1200
ggaatacact tgtgtttaag caccatggcc ttgatgattc actgttgggg agaagaaaca 1260
agaaaagtaa ctggttgtca cctatgagac ccttacgtga ttgttagtta agtttttatt 1320
caaagcagct gtaatttagt taataaaata attatgatct atgttgtttg cccaattgag 1380
atccagtttt ttgttgttat ttttaatcaa ttaggggcaa tagtagaatg gacaatttcc 1440
aagaatgatg cctttcaggt cctagggcct ctggcctcta ggtaaccagt ttaaattggt 1500
tcagggtgat aactacttag cactgccctg gtgattaccc agagatatct atgaaaacca 1560
gtggcttcca tcaaaccttt gccaactcag gttcacagca gctttgggca gttatggcag 1620
tatggcatta gctgagaggt gtctgccact tctgggtcaa tggaataata aattaagtac 1680
aggcaggaat ttggttggga gcatcttgta tgatctccgt atgatgtgat attgatggag 1740
atagtggtcc tcattcttgg gggttgccat tcccacattc ccccttcaac aaacagtgta 1800
acaggtcctt cccagattta gggtactttt attgatggat atgttttcct tttattcaca 1860
taaccccttg aaaccctgtc ttgtcctcct gttacttgct tctgctgtac aagatgtagc 1920
accttttctc ctctttgaac atggtctagt gacacggtag caccagttgc aggaaggagc 1980
cagacttgtt ctcagagcac tgtgttcaca cttttcagca aaaatagcta tggttgtaac 2040
atatgtattc ccttcctctg atttgaaggc aaaaatctac agtgtttctt cacttctttt 2100
ctgatctggg gcatgaaaaa agcaagattg aaatttgaac tatgagtctc ctgcatggca 2160
acaaaatgtg tgtcaccatc aggccaacag gccagccctt gaatggggat ttattactgt 2220
tgtatctatg ttgcatgata aacattcatc accttcctcc tgtagtcctg cctcgtactc 2280
cccttcccct atgattgaaa agtaaacaaa acccacattt cctatcctgg ttagaagaaa 2340
attaatgttc tgacagttgt gatcgcctgg agtactttta gacttttagc attcgttttt 2400
tacctgtttg tggatgtgtg tttgtatgtg catacgtatg agataggcac atgcatcttc 2460
tgtatggaca aaggtggggt acctacagga gagcaaaggt taattttgtg cttttagtaa 2520
aaacatttaa atacaaagtt ctttattggg tggaattata tttgatgcaa atatttgatc 2580
acttaaaact tttaaaactt ctaggtaatt tgccacgctt tttgactgct caccaatacc 2640
ctgtaaaaat acgtaattct tcctgtttgt gtaataagat attcatattt gtagttgcat 2700
taataatagt tatttcttag tccatcagat gttcccgtgt gcctctttta tgccaaattg 2760
attgtcatat ttcatgttgg gaccaagtag tttgcccatg gcaaacctaa atttatgacc 2820
tgctgaggcc tctcagaaaa ctgagcatac tagcaagaca gctcttcttg aaaaaaaaaa 2880
tatgtataca caaatatata cgtatatcta tatatacgta tgtatataca cacatgtata 2940
ttcttccttg attgtgtagc tgtccaaaat aataacatat atagagggag ctgtattcct 3000
ttatacaaat ctgatggctc ctgcagcact ttttccttct gaaaatattt acattttgct 3060
aacctagttt gttactttaa aaatcagttt tgatgaaagg agggaaaagc agatggactt 3120
gaaaaagatc caagctccta ttagaaaagg tatgaaaatc tttatagtaa aattttttat 3180
aaactaaagt tgtacctttt aatatgtagt aaactctcat ttatttgggg ttcgctcttg 3240
gatctcatcc atccattgtg ttctctttaa tgctgcctgc cttttgaggc attcactgcc 3300
ctagacaatg ccaccagaga tagtggggga aatgccagat gaaaccaact cttgctctca 3360
ctagttgtca gcttctctgg ataagtgacc acagaagcag gagtcctcct gcttgggcat 3420
cattgggcca gttccttctc tttaaatcag atttgtaatg gctcccaaat tccatcacat 3480
cacatttaaa ttgcagacag tgttttgcac atcatgtatc tgttttgtcc cataatatgc 3540
tttttactcc ctgatcccag tttctgctgt tgactcttcc attcagtttt atttattgtg 3600
tgttctcaca gtgacaccat ttgtcctttt ctgcaacaac ctttccagct acttttgcca 3660
aattctattt gtcttctcct tcaaaacatt ctcctttgca gttcctcttc atctgtgtag 3720
ctgctctttt gtctcttaac ttaccattcc tatagtactt tatgcatctc tgcttagttc 3780
tattagtttt ttggccttgc tcttctcctt gattttaaaa ttccttctat agctagagct 3840
tttctttctt tcattctctc ttcctgcagt gttttgcata catcagaagc taggtacata 3900
agttaaatga ttgagagttg gctgtattta gatttatcac tttttaatag ggtgagcttg 3960
agagttttct ttctttctgt tttttttttt tgtttttttt tttttttttt tttttttttt 4020
ttttgactaa tttcacatgc tctaaaaacc ttcaaaggtg attatttttc tcctggaaac 4080
tccaggtcca ttctgtttaa atccctaaga atgtcagaat taaaataaca gggctatccc 4140
gtaattggaa atatttcttt tttcaggatg ctatagtcaa tttagtaagt gaccaccaaa 4200
ttgttatttg cactaacaaa gctcaaaaca cgataagttt actcctccat ctcagtaata 4260
aaaattaagc tgtaatcaac cttctaggtt tctcttgtct taaaatgggt attcaaaaat 4320
ggggatctgt ggtgtatgta tggaaacaca tactccttaa tttacctgtt gttggaaact 4380
ggagaaatga ttgtcgggca accgtttatt ttttattgta ttttatttgg ttgagggatt 4440
tttttataaa cagttttact tgtgtcatat tttaaaatta ctaactgcca tcacctgctg 4500
gggtcctttg ttaggtcatt ttcagtgact aatagggata atccaggtaa ctttgaagag 4560
atgagcagtg agtgaccagg cagtttttct gcctttagct ttgacagttc ttaattaaga 4620
tcattgaaga ccagctttct cataaatttc tctttttgaa aaaaagaaag catttgtact 4680
aagctcctct gtaagacaac atcttaaatc ttaaaagtgt tgttatcatg actggtgaga 4740
gaagaaaaca ttttgttttt attaaatgga gcattattta caaaaagcca ttgttgagaa 4800
ttagatccca catcgtataa atatctatta accattctaa ataaagagaa ctccagtgtt 4860
gctatgtgca agatcctctc ttggagcttt tttgcatagc aattaaaggt gtgctatttg 4920
tcagtagcca tttttttgca gtgatttgaa gaccaaagtt gttttacagc tgtgttaccg 4980
ttaaaggttt ttttttttat atgtattaaa tcaatttatc actgtttaaa gctttgaata 5040
tctgcaatct ttgccaaggt acttttttat ttaaaaaaaa acataacttt gtaaatatta 5100
ccctgtaata ttatatatac ttaataaaac attttaagct attttgttgg gctatttcta 5160
ttgctgctac agcagaccac aagcacattt ctgaaaaatt taatttatta atgtattttt 5220
aagttgctta tattctaggt aacaatgtaa agaatgattt aaaatattaa ttatgaattt 5280
tttgagtata atacccaata agcttttaat tagagcagag ttttaattaa aagttttaaa 5340
tcagtc 5346
<210> 39
<211> 1247
<212> DNA
<213> 智人
<400> 39
ggacagccgg gcaggcgggg ctgggcgcgg gcggcggcgg cccggaggag aacgggcgga 60
gggcgcgggc cgaccgggcg caccgaccat ggcctccaaa tgccccaagt gcgacaagac 120
cgtgtacttc gccgagaagg tgagctccct ggggaaggac tggcacaagt tctgcctcaa 180
gtgcgagcgc tgcagcaaga cgctgacgcc cgggggccac gccgagcatg acgggaagcc 240
gttctgccac aagccgtgct acgccaccct gttcggaccc aaaggcgtga acatcggggg 300
cgcgggctcc tacatctacg agaagcccct ggcggagggg ccgcaggtca ccggccccat 360
cgaggtcccc gcggcccgag cagaggagcg gaaggcgagc ggccccccga aggggcccag 420
cagagcctcc agtgtcacca ctttcaccgg ggagcccaac acgtgcccgc gctgcagcaa 480
gaaggtgtac ttcgctgaga aggtgacgtc tctgggcaag gattggcacc ggccctgcct 540
gcgctgcgag cgctgcggga agacactgac ccccggcggg cacgcggagc acgacggcca 600
gccctactgc cacaagccct gctatggaat cctcttcgga cccaagggag tgaacaccgg 660
tgcggtgggc agctacatct atgaccggga ccccgaaggc aaggtccagc cctaggctac 720
agcggctctc atgatgtggg ctcacctgcg ccccagaccc tgcaggggcc cccctgcttg 780
gctctgctgg gagagtgctc agccgcccag tcctgcctgc aagcccaggg cgagtattgg 840
aggaggggca gccacgggca gagcaccatg cccatccccg agtctctggt gtgtctgccc 900
cctctggcat cctctgggcg tcccatgatc ccttctgtgt ctgcgtgtcc gaatccccgt 960
gtgaccctgt cccagcattt tcccgccgac cctgcgtgtc cccgtggcgc tgtccgctct 1020
ccctctcctg ctgcccaccc acctgccagt gttatttatg ctcccttcgt gggtgatggc 1080
cacgccctca ccatgtccct ggcagagggc ttccctccgg gatcccctgc ctggtgccca 1140
cactgcctcg caagcgctcg ccaccctcac gtggctcacc tgctgttgag ccttgtgctg 1200
tcaataaacg gtttgaggat tgcaggattg tcaaaaaaaa aaaaaaa 1247
<210> 40
<211> 2397
<212> DNA
<213> 智人
<400> 40
cacgcgcccc tcctccgcat ctgagcgggg gagcggcggc ccccagctga atgggcgcga 60
gagcggcgct gggggcgggt gggggcgcgg ggtaccgggc tggcggccgg ccggcgcccc 120
ctcattagta tgcggacgaa ggcggcgggc tgcgcggagc ggcgtcccct gcagccgcgg 180
accgaggcag cggcggcacc tgccggccga gcaatgccaa gtgagtacac ctatgtgaaa 240
ctgagaagtg attgctcgag gccttccctg caatggtaca cccgagctca aagcaagatg 300
agaaggccca gcttgttatt aaaagacatc ctcaaatgta cattgcttgt gtttggagtg 360
tggatccttt atatcctcaa gttaaattat actactgaag aatgtgacat gaaaaaaatg 420
cattatgtgg accctgacca tgtaaagaga gctcagaaat atgctcagca agtcttgcag 480
aaggaatgtc gtcccaagtt tgccaagaca tcaatggcgc tgttatttga gcacaggtat 540
agcgtggact tactcccttt tgtgcagaag gcccccaaag acagtgaagc tgagtccaag 600
tacgatcctc cttttgggtt ccggaagttc tccagtaaag tccagaccct cttggaactc 660
ttgccagagc acgacctccc tgaacacttg aaagccaaga cctgtcggcg ctgtgtggtt 720
attggaagcg gaggaatact gcacggatta gaactgggcc acaccctgaa ccagttcgat 780
gttgtgataa ggttaaacag tgcaccagtt gagggatatt cagaacatgt tggaaataaa 840
actactataa ggatgactta tccagagggc gcaccactgt ctgaccttga atattattcc 900
aatgacttat ttgttgctgt tttatttaag agtgttgatt tcaactggct tcaagcaatg 960
gtaaaaaagg aaaccctgcc attctgggta cgactcttct tttggaagca ggtggcagaa 1020
aaaatcccac tgcagccaaa acatttcagg attttgaatc cagttatcat caaagagact 1080
gcctttgaca tccttcagta ctcagagcct cagtcaaggt tctggggccg agataagaac 1140
gtccccacaa tcggtgtcat tgccgttgtc ttagccacac atctgtgcga tgaagtcagt 1200
ttggcgggtt ttggatatga cctcaatcaa cccagaacac ctttgcacta cttcgacagt 1260
caatgcatgg ctgctatgaa ctttcagacc atgcataatg tgacaacgga aaccaagttc 1320
ctcttaaagc tggtcaaaga gggagtggtg aaagatctca gtggaggcat tgatcgtgaa 1380
ttttgaacac agaaaacctc agttgaaaat gcaactctaa ctctgagagc tgtttttgac 1440
agccttcttg atgtatttct ccatcctgca gatactttga agtgcagctc atgtttttaa 1500
cttttaattt aaaaacacaa aaaaaatttt agctcttccc actttttttt tcctatttat 1560
ttgaggtcag tgtttgtttt tgcacaccat tttgtaaatg aaacttaaga attgaattgg 1620
aaagacttct caaagagaat tgtatgtaac gatgttgtat tgatttttaa gaaagtaatt 1680
taatttgtaa aacttctgct cgtttacact gcacattgaa tacaggtaac taattggaag 1740
gagaggggag gtcactcttt tgatggtggc cctgaacctc attctggttc cctgctgcgc 1800
tgcttggtgt gacccacgga ggatccactc ccaggatgac gtgctccgta gctctgctgc 1860
tgatactggg tctgcgatgc agcggcgtga ggcctgggct ggttggagaa ggtcacaacc 1920
cttctctgtt ggtctgcctt ctgctgaaag actcgagaac caaccaggga agctgtcctg 1980
gaggtccctg gtcggagagg gacatagaat ctgtgacctc tgacaactgt gaagccaccc 2040
tgggctacag aaaccacagt cttcccagca attattacaa ttcttgaatt ccttggggat 2100
tttttactgc cctttcaaag cacttaagtg ttagatctaa cgtgttccag tgtctgtctg 2160
aggtgactta aaaaatcaga acaaaacttc tattatccag agtcatggga gagtacaccc 2220
tttccaggaa taatgttttg ggaaacactg aaatgaaatc ttcccagtat tataaattgt 2280
gtatttaaaa aaaagaaact tttctgaatg cctacctggc ggtgtatacc aggcagtgtg 2340
ccagtttaaa aagatgaaaa agaataaaaa cttttgagga acaaaaaaaa aaaaaaa 2397
<210> 41
<211> 2697
<212> DNA
<213> 智人
<400> 41
acttgtccgt cacgtgcggc cgcccggcct ctcggccttg ccgcgcgcct ggcggggttg 60
ggggggcggg gaccaagatc tgctgcgcct gcgttgtggg cgttctcggg gagctgctgc 120
cgtagctgcc gccgccgcta ccaccgcgtt cgggtgtaga atttggaatc cctgcgccgc 180
gttaacaatg aagcagagtt cgaacgtgcc ggctttcctc agcaagctgt ggacgcttgt 240
ggaggaaacc cacactaacg agttcatcac ctggagccag aatggccaaa gttttctggt 300
cttggatgag caacgatttg caaaagaaat tcttcccaaa tatttcaagc acaataatat 360
ggcaagcttt gtgaggcaac tgaatatgta tggtttccgt aaagtagtac atatcgactc 420
tggaattgta aagcaagaaa gagatggtcc tgtagaattt cagcatcctt acttcaaaca 480
aggacaggat gacttgttgg agaacattaa aaggaaggtt tcatcttcaa aaccagaaga 540
aaataaaatt cgtcaggaag atttaacaaa aattataagt agtgctcaga aggttcagat 600
aaaacaggaa actattgagt ccaggctttc tgaattaaaa agtgagaatg agtccctttg 660
gaaggaggtg tcagaattac gagcaaagca tgcacaacag caacaagtta ttcgaaagat 720
tgtccagttt attgttacat tggttcaaaa taaccaactt gtgagtttaa aacgtaaaag 780
gcctctactt ctaaacacta atggagccca aaagaagaac ctgtttcagc acatagtcaa 840
agaaccaact gataatcatc atcataaagt tccacacagt aggactgaag gtttaaagcc 900
aagggagagg atttcagatg acatcattat ttatgatgtt actgatgata atgcagatga 960
agaaaatatc ccagttattc cagaaactaa tgaggatgtt atatctgatc cctccaactg 1020
tagccagtac cctgatattg tcatcgttga agatgacaat gaagatgagt atgcacctgt 1080
cattcagagt ggagagcaga atgaaccagc cagagaatcc ctaagttcag gcagtgatgg 1140
cagcagccct ctcatgtcta gtgctgtcca gctaaatggc tcatccagtc tgacctcaga 1200
agatccagtg accatgatgg attccatttt gaatgataac atcaatcttt tgggaaaggt 1260
tgagctgttg gattatcttg acagtattga ctgcagttta gaggacttcc aggccatgct 1320
atcaggaaga caatttagca tagacccaga tctcctggtt gatcttttca ctagttctgt 1380
gcagatgaat cccacagatt acatcaataa tacaaaatct gagaataaag gattagaaac 1440
taccaagaac aatgtagttc agccagtttc ggaagaggga agaaaatcta aatccaaacc 1500
agataagcag cttatccagt ataccgcctt tccacttctt gcattcctcg atgggaaccc 1560
tgcttcttct gttgaacagg cgagtacaac agcatcatca gaagttttgt cctctgtaga 1620
taaacccata gaagttgatg agcttctgga tagcagccta gacccagaac caacccaaag 1680
taagcttgtt cgcctggagc cattgactga agctgaagct agtgaagcta cactgtttta 1740
tttatgtgaa cttgctcctg cacctctgga tagtgatatg ccacttttag atagctaaat 1800
ccccaggaag tggactttac atgtatatat tcatcaaaat gatgaactat ttattttaaa 1860
gtatcatttg gtactttttt tgtaaattgc tttgttttgt ttaatcagat actgtggaat 1920
aaaagcacct tttgcttttc tcactaacca cacactcttg cagagctttc aggtgttact 1980
cagctgcata gttacgcaga tgtaatgcac attattggcg tatctttaag ttggattcaa 2040
atggccattt ttctccaatt ttggtaaatt ggatatcttt tttttacaaa tacgaccatt 2100
aacctcagtt aaatttttgt ttgttttcct gtttgatgct gtctatttgc attgagtgta 2160
agtcatttga actaatggta taactcctaa agctttctct gctccagtta tttttattaa 2220
atatttttca cttggcttat ttttaaaact gggaacataa agtgcctgta tcttgtaaaa 2280
cttcatttgt ttcttttggt tcagagaagt tcatttatgt tcaaagacgt ttattcatgt 2340
tcaacaggaa agacaaagtg tacgtgaatg ctcgctgtct gatagggttc cagctccata 2400
tatatagaaa gatcgggggt gggatgggat ggagtgagcc ccatccagtt agttggacta 2460
gttttaaata aaggttttcc ggtttgtgtt tttttgaacc atactgttta gtaaaataaa 2520
tacaatgaat gttgagtact agtgtctgtt atgtgtcttc tttagaggtg acactcacat 2580
gaaacaattt tttcttctca taggaagcag tagctttaaa ctgtctgtgg ttcattattc 2640
tcaatatgaa tcataccaag atatttgtgc ctcatctcga aaatatattg tatattg 2697
<210> 42
<211> 1562
<212> DNA
<213> 智人
<400> 42
gcgggcggca ttctggcgcg gagcggagcg gcggcgggcg cagctagcgg gtcggccgcg 60
gagcggaggt gcagctcggc ttcccccggc acccctcccc ctcgggcgcc agccccaccc 120
ctccgccggc cgggccgacc ccgccgtact atcccctgcg gcgcgagccc ggggcggctc 180
caagcgcccc ccagcagacc cccatcatgg gcagccagag ctccaaggct ccccggggcg 240
acgtgaccgc cgaggaggca gcaggcgctt cccccgcgaa ggccaacggc caggagaatg 300
gccacgtgaa aagcaatgga gacttatccc ccaagggtga aggggagtcg ccccctgtga 360
acggaacaga tgaggcagcc ggggccactg gcgatgccat cgagccagca ccccctagcc 420
agggtgctga ggccaagggg gaggtccccc ccaaggagac ccccaagaag aagaagaaat 480
tctctttcaa gaagcctttc aaattgagcg gcctgtcctt caagagaaat cggaaggagg 540
gtgggggtga ttcttctgcc tcctcaccca cagaggaaga gcaggagcag ggggagatcg 600
gtgcctgcag cgacgagggc actgctcagg aagggaaggc cgcagccacc cctgagagcc 660
aggaacccca ggccaagggg gcagaggcta gtgcagcctc agaagaagag gcagggcccc 720
aggctacaga gccatccact ccctcggggc cggagagtgg ccctacacca gccagcgctg 780
agcagaatga gtagctaggt aggggcaggt gggtgatctc taagctgcaa aaactgtgct 840
gtccttgtga ggtcactgcc tggacctggt gccctggctg ccttcctgtg cccagaaagg 900
aaggggctat tgcctcctcc cagccacgtt ccctttcctc ctctccctcc tgtggattct 960
cccatcagcc atctggttct cctcttaagg ccagttgaag atggtccctt acagcttccc 1020
aagttaggtt agtgatgtga aatgctcctg tccctggccc tacctccttc cctgtcccca 1080
cccctgcata aggcagttgt tggttttctt ccccaattct tttccaagta ggttttgttt 1140
accctactcc ccaaatccct gagccagaag tggggtgctt atactcccaa accttgagtg 1200
tccagccttc ccctgttgtt tttagtctct tgtgctgtgc ctagtggcac ctgggctggg 1260
gaggacactg ccccgtctag gtttttataa atgtcttact caagttcaaa cctccagcct 1320
gtgaatcaac tgtgtctctt ttttgacttg gtaagcaagt attaggcttt ggggtggggg 1380
gaggtctgta atgtgaaaca acttcttgtc tttttttctc ccactgttgt aaataacttt 1440
taatggccaa accccagatt tgtacttttt ttttttttct aactgctaaa accattctct 1500
tccacctggt tttactgtaa catttggaaa aggaataaat gtcgtccctt tagtggtgct 1560
tt 1562
<210> 43
<211> 2000
<212> DNA
<213> 智人
<400> 43
agtcgctgag ccctggcgcc tccttaaagc cgcagctccg ccccgaccgc cccgcccgcc 60
agtccgtcct cagaccctcc caaccgccgg gtccccgccg cctcggcgga gtgttgtaga 120
gcctcgagcc tgcgaggagc gcgccgcccg ccagctccct gcgtcccgtc ccgcgtcccc 180
gcgttcccgc gtcctgcgat ccgccgccat ggccagtgag gagctggcgt gcaagctgga 240
gcgccggctg cggcgcgagg aggccgagga gagtggcccc cagctggctc ccctcggcgc 300
cccagccccg gagcccaagc ccgagcccga gcctcccgcc cgtgcgccca cggccagcgc 360
cgacgcggag ctgagcgccc agctgagccg gcggctggac atcaacgagg gcgctgcgcg 420
gccccggcgc tgcagggtct tcaaccccta cacggagttc ccggagttca gccgccgcct 480
catcaaggac ctggagagca tgttcaaact gtatgacgct gggcgggatg gcttcatcga 540
cctgatggag ctgaagctga tgatggagaa gctgggggcc ccccagaccc acctgggcct 600
gaagagcatg atcaaggagg tggatgagga cttcgatggc aagctcagct tccgggagtt 660
cctgctcatt ttccacaagg ccgcggcagg ggagctgcag gaggacagtg ggctgatggc 720
gctggcaaag ctttctgaga tcgatgtggc cctggagggt gtcaaaggtg ccaagaactt 780
ctttgaagcc aaggtccaag ccttgtcatc ggccagtaag tttgaagcag agttgaaagc 840
tgagcaagat gagcggaagc gggaggagga ggagaggcgg ctccgccagg cagccttcca 900
gaaactcaag gccaacttca atacatagtc ctgctgacct tgccctctgc ccacagctgt 960
gcctcacaga tgccccgaga agagatgact aggcatcttc atcactgctg tcggtcccct 1020
ccctgagcca gcatctccat ccaccacccc gtgccagctc ccgtgccagc cttcattcct 1080
cccagtgtcc aagcccctcc aggagggtcc tggggtgggc cagatgcctg cccacctctg 1140
tctcctgcct ctgctcctct gcccttctta tagccagaac ttgtatcttc tcagcaacct 1200
tcactttgtc cttgtccctt taccattccc catcaaagag tagtctgcta tatcaatttg 1260
tgtagatatg tctgtctttt tgggtcctca gagaaaatgc ccattttctc ggagaattct 1320
ctgcactcct ctctgcttca cattcaactt ccctgttctc atctttggta ggattctgcc 1380
agttgctttt gcatcttctg ttcctgggta atggtgggtc ttaatggagg ctgggtggac 1440
cactgcccgt ccactcttca acaggaggaa cagcatgcca ccatagtaac acacattaga 1500
gaaaggacag aggtctgctc cttcctgcca cctttctcct ggccccttag cattccccca 1560
gtccctccct cttcaccttg ctccgtctat gtcttcccag ctcagccttt tccccactct 1620
taaatactgt actacttcac tgtaagaacg aaagaatagt taggatacca atgagtaaaa 1680
gggttcctgt tcactctgac tctgtgcaaa ttgtattaca gtagaccgct gacgttccca 1740
agtgacagat ccagggcctt tcaaacatcc ccaaagtcat ggccatactc accattagcc 1800
agtttctaac atctgtttca gggtatccag ctgtagatgt tcttatcccc catacttgtg 1860
agttcttggg gttgctcaca aatactaggg gtttttgttg tatttttaac aaatatatcc 1920
taatgtcata tttattctct tttgtaactg ctgtctttac aataaagaaa tcatctgcct 1980
ttctatctta aaaaaaaaaa 2000
<210> 44
<211> 2733
<212> DNA
<213> 智人
<400> 44
ggcagaggag cgagtgcagc ggccagcagc acatccccgc tccacagtcg ccgcagtcgc 60
cgcagccgcc gccgccgccc cgcgcgccca accgccgcgg ccccctgccc cgccggcctg 120
ccagtgagag agcggcgagg gggcgcccgg ccggactctg agcctagtcc tctcgcgctg 180
cggccgcccg cgcctcctcg gccgcctgtc gggcatgaaa accaaattct gcaccggggg 240
cgaggcggag ccctcgccgc tcgggctgct gctgagctgc ggtagcggca gcgcggcccc 300
ggcgcccggc gtggggcagc agcgcgacgc cgccagcgac ctcgagtcca agcagctggg 360
cggccaacag ccgccgctcg cgctgccccc tccgccgccg ctgccgctgc cgctgccgct 420
gccccagccc ccgccgccgc agccgcccgc agacgagcag ccggagcccc ggacgcggcg 480
cagggcctat ctgtggtgca aggagttcct gcccggcgcc tggcggggcc tccgcgagga 540
cgagttccac atcagtgtca tcagaggcgg ccttagcaac atgctgttcc agtgctccct 600
acctgacacc acagccaccc ttggtgatga gcctcggaaa gtgctcctgc ggctgtatgg 660
agcgattttg cagatgaggt cctgtaataa agagggatcc gaacaagctc agaaagaaaa 720
tgaatttcaa ggggctgagg ccatggttct ggagagcgtt atgtttgcca ttctcgcaga 780
gaggtcactt gggccaaaac tctatggcat ctttccccaa ggccgactgg agcagttcat 840
cccgagccgg cgattagata ctgaagaatt aagtttgcca gatatttctg cagaaatcgc 900
cgagaaaatg gctacatttc atggtatgaa aatgccattc aataaggaac caaaatggct 960
ttttggcaca atggaaaagt atctaaagga agtgctgaga attaaattta ctgaggaatc 1020
cagaattaaa aagctccaca aattgctcag ttacaatctg cccttggaac tggaaaacct 1080
gagatcattg cttgaatcta ctccatctcc agttgtattt tgtcataatg actgtcaaga 1140
aggtaatatc ttgttgctgg aaggccgaga gaattctgaa aaacagaaac tgatgctcat 1200
tgatttcgaa tacagcagtt acaattacag gggattcgac attggaaatc acttctgtga 1260
gtggatgtat gattatagct atgaaaaata cccttttttc agagcaaaca tccggaagta 1320
tcccaccaag aaacaacagc tccattttat ttccagttac ttgcctgcat tccaaaatga 1380
ctttgaaaac ctcagtactg aagaaaaatc cattataaaa gaagaaatgt tgcttgaagt 1440
taataggttt gcccttgcat ctcatttcct ctggggactg tggtccattg tacaagccaa 1500
gatttcatct attgaatttg ggtacatgga ctacgcccaa gcaaggtttg atgcctattt 1560
ccaccagaag aggaagcttg gggtgtgact gtggggagga ctccatccac ctcatcactg 1620
gactgcatgg ggaggcagca gagcggggtc ccctctgtgc ttcgactact gctcctgtgg 1680
caggaggctt tgggtggctc actactgaac acatgtgtat gatactaaag acggtattaa 1740
aatggagcga cgtttatttc atctcttgtt tacgatttca ctaggactca gaaacgagat 1800
cgggaagcag aaatatagtg caatagtgca acatctctga atccttttaa tctagagaag 1860
gcatttcata tttgggggct aaggtttcca gtcagatgag gcaaacagca agagtaagca 1920
gtgttacttg caggtacttt ggttaatgtt gatttaaatt ttcatgaatg tgctggtgaa 1980
cactgtgacc aggcttttgt agatggcgat gtgttataga cggtgctcac tcccaaggga 2040
cagcaagtga gcagagatgt actgcaaagt cgccagtcac tgctgcaagg tggcctctgc 2100
ctggggcctc cagaagctgc tcctttaccc tcttggtccc atggctgaag ctggagcagc 2160
ggattgctct ggagcagcca aggccgccag cgtgtggagc agagctctcc cctcctgctg 2220
ggcgtgtgtg acactgatga gtttcactgt actgcatgtg acttctcccc tgcccttcct 2280
cctgatggag tgtgcagaca gccatgcgtg gccacggggg cagtgtgagg acctccctgt 2340
ctcccggctc ccctcccagg ggagccagct gcttgaccta gctctttggg cctctcctgc 2400
cctctgctct gcctggagtg tcggatcctg tgagtaggct gggcctcccc tgggcagggt 2460
tctccaaggg cccggtttcc cggcccttac ctttcctgat gcccctgaca tcatcattct 2520
tgtgggagac agcagcctgt atgtggtgtg gggcgtggat cgagtgtagc tgtgaaatcc 2580
atatatatga aatgtcctgc gggatacagt cttagctgac ttttttttac tctgaactct 2640
tatttgaatt gttttttgtg catatatttc tgctaccaca gagattgtac tatacaaata 2700
aaaaaataaa aacccaaaaa aaaaaaaaaa aaa 2733
<210> 45
<211> 2391
<212> DNA
<213> 智人
<400> 45
aagagaggaa ggcttaaaga gccagactgc gcagccagga ctggggtgat gggcgctgtc 60
ctgccaggcc aaagaatgaa gatgtagccc cgcccccaac ctagggagga ggaccagccc 120
ggttcctgtc ctgcccccgc aacctcgccc cgattccact ccgggaacct cggcgatgct 180
gagccaagac cacttctgaa tcagggatga cttgtctagt gaacctaggg tcagagccat 240
cagttggaaa ggctgggagg agcctggaga aagagggcga ccttccttgg gatctgtgcg 300
ctccctcctt gcctccccct ccagcctccc acttggtagc accttcctga tccccttatc 360
tctaaggcgc tcagggaaat gccccgctgc gggagccttc tgggaaatgc tgccctggcc 420
acccaggaac catgagccct gcagccccgg tcccgcctga ctccgctctg gaaagtcctt 480
ttgaagaaat ggccctggtg aggggcggct ggctgtggag acagagctcc atcctccgcc 540
gctggaagcg gaactggttt gccctgtggc tggacgggac cctgggatac taccacgatg 600
agacagcgca ggacgaggag gaccgtgtgc tcatccactt caatgtccgt gacataaaga 660
tcggcccaga gtgccatgat gtgcagcccc cagagggccg gagccgagat ggcctgctga 720
ctgtgaacct acgggaaggc ggccgcctgc acctctgtgc ggagaccaag gatgatgccc 780
tagcatggaa gacagcactg ctggaggcaa actccacccc ggccccagct ggagccaccg 840
tccctcccag gagccgccgg gtttgctcca aggtcaggtg tgtgacccgc tcgtggagcc 900
cctgtaaggt tgagaggcgg atctgggtgc gcgtctacag cccgtaccaa gactactacg 960
aggtggtgcc ccccaatgca cacgaggcca cgtatgtccg cagctactac ggaccgccct 1020
acgcaggccc tggcgtgacg cacgtgatag tgcgggagga tccctgctac agcgccggcg 1080
cccctctggc catgggcatg cttgcgggag ccgccactgg ggcggcgctg ggctcgctca 1140
tgtggtcgcc ctgctggttc tgagccctgg gactcggagc actgacccct gcgcttggat 1200
tgctagactc ctcttcctcc tggaccccat cctctaccat ccaagccctg tcccactttg 1260
gccctatcct ctccattagc tccttccggg tttggaccat tccccccact ccctaccctt 1320
aatccccaca tgggaagaag ctatcatcac aggtacaaac atcgcttgaa gtcttcacat 1380
ctaccactag acacccccaa aatctgttat agacatttat ggatacattt cctctaaaca 1440
caacagggca cagcaaatac gacttcattt ggcttcgagt tccccaggcg ctgtagacac 1500
aacatgaatc gggctctctg ctctctcctt agggagctcg agtcctggtg gggagaacag 1560
gagtaaacaa ggacttgaca aagctgaaga gttatcagtc ctttgacaag gacaggtggg 1620
gcagggagca agacaggtag gctggaagaa cagttattgg caagtatgca gagccgtgaa 1680
cgtcatggca tgtccaagga attaaatggg agttcatttg ggctggggtg gaggctggga 1740
tcagaccgtg gtgggccttc aagctaagga gcttcctagg tgaaagggga gatgtgagcc 1800
ttctctggag ggaagtttca tgattgcatc tataatgaat atattgcctg ttttgtgaat 1860
actgacacat gtccatacct aaaacactcc tgagttaagt cccatccttc ccacaaacag 1920
cttcctggct ggtacccatg ataacaattg agctgaacct ggggacccct ggttggggaa 1980
caggtgagtt ctatttgaga cttccagccc tagaaagctg cctccgtcca gaaatgcctc 2040
tcacaccagg agctcggccc tctctttgta gctgtgactg tcaccctctc aggctttgtc 2100
tcatccttca ttctgaataa gatggcagtg ttctcctctg gggcctgatc cacctctaca 2160
ccagcccagg aagccccatc tgtgcctgcc ctcaggtggt ccaccagtct ccccctttgg 2220
ttcccttcca gtctcttccc cctttctatc ccaatcacca atagaaatgc taacatccct 2280
gcctggtagc cagactagcc cactaaagct cccctgtaaa tgggggctcc attagttctg 2340
ctgccgagac taataaagat ttggttggct ctagcagtaa aaaaaaaaaa a 2391
<210> 46
<211> 5371
<212> DNA
<213> 智人
<400> 46
tcactcactg gggagcccgg cggtggcggc acctttcgag gtagacccgc tgagctgcta 60
gcccgccggc cagcgagtga gaggtcggac agactgtgga gccgacagac tgaaggacag 120
cggcaccgcc agacggccag aaagttccgc catgagctgg ggcacggagc tgtgggatca 180
gttcgacagc ttagacaagc atacacaatg gggaattgac ttcttggaaa gatatgccaa 240
atttgttaaa gagaggatag aaattgaaca gaactatgcg aaacaattga gaaatctggt 300
taagaagtac tgccccaaac gttcatccaa agatgaagag ccacggttta cctcgtgtgt 360
agcctttttt aatatcctta atgagttaaa tgactatgca ggacagcgag aagttgtagc 420
agaagaaatg gcgcacagag tgtatggtga attaatgaga tatgctcatg atctgaaaac 480
tgaaagaaaa atgcatctgc aagaaggacg aaaagctcaa caatatcttg acatgtgctg 540
gaaacagatg gataatagta aaaagaagtt tgaaagagaa tgtagagagg cagaaaaggc 600
acaacagagt tatgaaagat tggataatga tactaatgca accaaggcag atgttgaaaa 660
ggccaaacag cagttgaatc tgcgtacgca tatggccgat gaaaataaaa atgaatatgc 720
tgcacaatta caaaacttta atggagaaca acataaacat ttttatgtag tgattcctca 780
gatttacaag caactacaag aaatggacga acgaaggact attaaactca gtgagtgtta 840
cagaggattt gctgactcag aacgcaaagt tattcccatc atttcaaaat gtttggaagg 900
aatgattctt gcagcaaaat cagttgatga aagaagagac tctcaaatgg tggtagactc 960
cttcaaatct ggttttgaac ctccaggaga ctttccattt gaagattaca gtcaacatat 1020
atatagaacc atttctgatg ggactatcag tgcatccaaa caggagagtg ggaagatgga 1080
tgccaaaacc acagtaggaa aggccaaggg caaattgtgg ctctttggaa agaagccaaa 1140
gggcccagca ctagaagatt tcagtcatct gccaccagaa cagagacgta aaaaactaca 1200
gcagcgcatt gatgaactta acagagaact acagaaagaa tcagaccaaa aagatgcact 1260
caacaaaatg aaagatgtat atgagaagaa tccacaaatg ggggatccag ggagtttgca 1320
gcctaaatta gcagagacca tgaataacat tgaccgccta cgaatggaaa tccataagaa 1380
tgaggcttgg ctctctgaag tcgaaggcaa aacaggtggg agaggagaca gaagacatag 1440
cagtgacata aatcatcttg taacacaggg acgagaaagt cctgagggaa gttacactga 1500
tgatgcaaac caggaagtcc gtgggccacc ccagcagcat ggtcaccaca atgagtttga 1560
tgatgaattt gaggatgatg atcccttgcc tgctattgga cactgcaaag ctatctaccc 1620
ttttgatgga cataatgaag gtactctagc aatgaaagaa ggtgaagttc tctacattat 1680
agaggaggac aaaggtgacg gatggacaag agctcggaga cagaacggtg aagaaggcta 1740
cgttcccacg tcatacatag atgtaactct agagaaaaac agtaaaggtg cagtaactta 1800
tatctaaact aaccaggcac ctttgtgcca tgtgtgacat aggaagagta acataaaatg 1860
aaaacacatt caacaggttg aaaaaaataa ggaaacttaa agggcatcca agattaattg 1920
ttcactatgt gagctgagtg taggcttgat cttgtgaata ttaccacaag aaacattttg 1980
tggcacttta ctgtttgagt aacgttggtg tgaagcttaa ttgatgcctt ttgctttatg 2040
tcccgcttaa gtctgtgtga aggatttgtg tttttctgcc ttacaaatag aatttgattt 2100
attgggcagg aattcatgga tagtaatgct ctctgccccc tttacttcag aaaacacagt 2160
gactttagtg aatttgaata gtgaaactgc tctgaaatgc tatggaaagc cgactcccca 2220
aagagtggtt tcttctagaa gtttgaattt gtagctacag tttccaagaa gaaaaatagt 2280
agttggataa tttagtaaaa taataacatc attttcattt tcttacctat tcttaacttt 2340
ggtttcctaa aggaagaaaa tgagcaggta gcacataatc tatttaagta gatttaaaga 2400
gagtttcaaa ataaatctcc tggtctagct cttaggtgaa taaaatagat tttgtttgag 2460
acctcaaaat attttgaggt tagctggtaa ttttcaataa tttacaagct tccttccaaa 2520
ctaatctcat acttttgtat gtttcatctt gaaaatatct tttgggaaat accactttag 2580
tgattattta gcatttagca gttacacata ggaaaataca cagttacata gaaaaataca 2640
catttgaaga tagaggaaac cttgaatgga ggggaagtgt tgacaaattt taatttttaa 2700
aggagaaact ttttgactat ctgggttaga ggaagatatg tgtaccgcct ttagggcatt 2760
ttgttatttc cgctgaatca ttagttatta ggatagataa atttttccaa ttagtttcag 2820
caagcgttgt tggaaacact gtgcagtcaa ggattgtgca gtgctggttg tgtgaccaca 2880
ccctgagtca gtggtgtggg gaagtaaagt gtgaagaagc agtaagattg gtttttaatt 2940
ttgcccatgt tttaaatttt cctggtgttt tcggtagctg actataaaat gatagagaca 3000
tttgggacag gcactttaaa ctgaacaccc cttttggttt taccaaaggt cttcagtaat 3060
tgttcttttc tttttcctcc tggactgcag gttcctgaag agggtttctg aggaaatggg 3120
caagatgttg aaggaggtta catgcagctg cttttggggg agggtattag agttgtcagg 3180
ctcaaagaga gtgagagaag caagttgcat gagtgcatgc agacatgatt ttttttttac 3240
taacttcatt agcatttcca tacattgttt ttaaaaatca taataccaac ccttaagttc 3300
ctagttcaca gttattccca caaaagaaaa agccaacaat agtgtaccat ttttctattt 3360
attttattgc tgtctaatca ataaagaatg cagagctgtc aaaaaatgtg tcttacatta 3420
gctgtcccaa caggattgtc ttccctccca gctctgtttt aattggcttt tagacccact 3480
atctgtcaga tccttgccat ctgtcagtgt ctgcctgcgc cacctccgtg cttgcttaac 3540
atcctgttgc atgtctagcg tgattgagct agatttttca ggcatgtctt tagattccct 3600
tgttcttgtc aaagccttgt tttgttttac atttgtagtg caaatcactt tgtcaaacat 3660
ctccagcact aatgtttcca tcttagtatt tgtgcacact gctataactt ccccactgca 3720
aacattccag ttttggcatt acgaagaagt agctgtgaac ctgaagtatt tatgataaga 3780
aaaagaaaac atctctgctg tagcctacag cccagttgaa agaactcttt gaaacgtgat 3840
acatcttcag cacctcagtc tgggaagaat ctagtcagca ctgaaatcct ggcataataa 3900
acacagaaga tattcaccac ctcaagacaa aggactattg tcaaaagtca gctgcttcca 3960
ttcaaatgct gccttaaact tgagtgccta aatctgttga ttgccaacac taccactaca 4020
gtatcccaca aagggcttta tgtgtcagct cagtgcgacc tgctttaact ctgcagcacc 4080
gctgcagctg ccgatgtagc ctcggtaggt ggctattaga gctctaccat atacagtggt 4140
gcatcttcaa atttatgcat caaactaaag acatgtccaa gtccatttta atttcctcag 4200
tggttttatg agaagtttta tgggcctccc ccaattgtct ttttattttg ggttatgacg 4260
atcatgtttg ataattacaa tgatagtctc tttccacgtg atgcttttgt ttgaacctga 4320
taaaatttag tgaaactttg taatgatcta tgtgcacttt tacttgtaaa atggaatttc 4380
tgtatgttta tacttgtaaa tatgattgtt gttagtgctc ctgttgctca tggtgtcctg 4440
cctcgcattt gtgattctgt taatgacatg tatcttaact aatttcttag tggtgttgta 4500
atagggagat ggggcaggtg gggggttatt tgtaccactg aatcttcatt aatttggttc 4560
tttactgttt tgaggggaga aagaacgtga aatggtttgt gtattattga attttaagca 4620
atattttaga agctgtgtga ctgctttaat aactttttcc cagtgttatt tgaatcatac 4680
tacccgttat actaaagctg aatgacaatt gtgtgaaagt tactgccttc ataagatcaa 4740
gtcaccactg ttacacagct gacatatagt gtattacctt tgcagctagt aaactataaa 4800
gtttagatat tgaatctcgt tacagggtta tttatataat gtgacattat tcagtactga 4860
cagactacat gaagtagttt taaaatctag tgctattttt attttaaagg ttagcaatga 4920
ggaggaaatg tgatctggct gtgtttgtct tctgtacaaa gcctgaagtg cttatggttt 4980
tttggctaac agccacagag ggcaaagttt aagactttct tgtaaggact aactgttctt 5040
ttcaagctac tgtttgtttt tctaaaagca ggatttgctt ccgtaggagg caagttcctt 5100
gatgtggaat agtgcaacct gtatatgggt tattataata ggaaagacat ttgtacttgc 5160
acagtttaaa tcattcttaa attttgaaca tgtgaattgt cccaaaaaat ctttaatttt 5220
ttggtaattt ttactctttt tgtgcacatg ttgatttctt aatggtaaat ccttcattta 5280
aagatagtgt tctctgttga gaatatttac atggaataaa acaatctttt catggcctgt 5340
taaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 5371
<210> 47
<211> 2406
<212> DNA
<213> 智人
<400> 47
ctagtcccga ttatggttat tacagtttga tgaaatgtgg ctgagatcat tggcactgtg 60
gagattaaga aatgtgaggt cagagtgttg ggtaaattgt tcctgcgagt gttaaggttg 120
tcaggataat ggtgggaatg gggtgaagat gacaactcag caatgacaca agaagagagt 180
gacacagaaa gattcagtag ctgagaactt gagcgtagat atgttgtggg caggagggaa 240
atgatttgga tggaagtagc caagtaagtg agaaaggaaa gactttccaa caaaacttgg 300
cttagctcac tcagatccct gagctgcaaa cttcttctat acctttctta ccttttccag 360
tgctgctgac ttcaccccac ttgcagggca tttgtgcaga tggttgtttg ttgaggagga 420
atgtgcttaa tgttttagga accagttaca ttcaaggatg cctctgtggc cttcaccgag 480
gaggagtgag gtcacctgga ctctgctccc aggaagctgt gcggagctgt gatgctgggc 540
aactacagaa acttggtctt ggagacttga atgaaaattc tgtggagaat cttcagcaga 600
aaacacttca ggatctgtta catgagcttt cctcctggct agttttggaa ggcatggcca 660
gtacaattac tggaagtcag gattgtattg tgaatcatcg aggggaagtg gatggggagc 720
ctgaactaga tatttcccct tgtcaacagt ggggagaagc atcttctcct atttccagaa 780
acagggacag tgtgatgact cttcaaagtg gttgtttcga aaacattgaa agtgaaacat 840
atttgccttt gaaagtctca agccaaatag acacacaaga ctcttcagtg aagttctgta 900
agaatgagcc tcaggatcat caggaaagca gacgtctctt tgtaatggaa gaaagcactg 960
agagaaaagt gataaagggg gaaagttgtt cagagaacct tcaagttaaa ctggtgtctg 1020
atggacaaga actggcctcg ccattgttaa atggtgaggc aacttgccag aatggccagt 1080
taaaagaatc tttggatccc attgactgta actgcaaaga cattcatgga tggaaatcac 1140
aggtggtcag ttgtagtcag cagagagctc atacagagga gaaaccctgt gaccataata 1200
actgtgggaa aatacttaac accagcccag atggtcatcc atatgagaaa atccacactg 1260
cagagaaaca atacgaatgt agtcagtgtg gtaagaactt cagtcaaagc tcagagctac 1320
tacttcatca gagagaccac acagaagaaa aaccctacaa atgtgagcaa tgtgggaagg 1380
gcttcacaag gagctcgagt ctgcttatcc atcaggcagt ccacacagat gagaagcctt 1440
ataagtgtga caagtgtggg aagggcttca ccaggagctc aagtctgctc atccatcatg 1500
ccgtccatac aggcgaaaaa ccttataaat gtgacaagtg tgggaagggc tttagtcaga 1560
gctccaaact gcacatccac cagcgagtcc acactggaga gaagccctat gagtgtgagg 1620
agtgtggtat gagcttcagt cagcgctcaa acctgcacat ccaccagcga gtacacacag 1680
gagagaggcc ctacaagtgt ggtgagtgtg ggaagggctt cagtcagagc tcgaaccttc 1740
acattcaccg gtgcatccac acaggagaga agccttacca atgctatgag tgtgggaagg 1800
gtttcagcca gagctcggat cttcgcatcc atctcagagt ccacactgga gagaagccct 1860
atcactgtgg caagtgtggg aagggattta gccagagttc caaactcctc atccaccaga 1920
gagtacatac tggagagaag ccctatgagt gcagcaagtg tgggaagggc ttcagccaga 1980
gctccaacct tcacatccac cagcgggttc acaagaaaga tcctcgctaa ctgacattag 2040
cccattcagg tcttcacagc gctcatactg taaaaactgt taaatattta gtatcactct 2100
tactttatat tctacaaagg agagagatgt aagggttatt tagatatgtt ccctcactga 2160
aaaatcactc attcaaaata tttaagtatc aagcactttg ttatgctgta caatgaatgg 2220
attgttcttg tttctcagat gggtagagta aaagtgtctg tactttacaa ttcaactaca 2280
tgttctaccc agcattttaa cggcaagaac tttatattta ttctcaagca gggcatgttt 2340
ccctttgttc acattctctg agaaattgaa actctggttt ctcttcaaaa aaaaaaaaaa 2400
aaaaaa 2406
<210> 48
<211> 6647
<212> DNA
<213> 智人
<400> 48
gggaatcttt ttcgggctcc cgggggcgga gggaagggag cgcgcgtgcg cgcgcccggc 60
cggccgtcgc cgcggtgacc gtcctcggag tccgtcggct cgcgccccgc ccccgtcgcc 120
ccctcccctg tcgcgcgctg gggctgtttc tcgctccttc cgagttaccg ccgccgtcgc 180
cgccgctcct cctctcccgg tcctgggttt ccttggcgct gcggccgccg ctccctctgc 240
gacctgtatg aggaggagga ggaggaggat gtgaagatgg cggagctgca gatgctgctg 300
gaagaggaaa tcccgggggg ccgccgggcc ctcttcgaca gctacacaaa tctggaacgg 360
gtggccgatt actgcgagaa caactacata cagtcagcag ataagcagag agccctagaa 420
gaaaccaaag cctacaccac ccaatcctta gcaagtgttg cctatctgat aaacaccttg 480
gccaacaatg tcctgcagat gctggatatc caggcatccc agctacgaag gatggaatct 540
tcaatcaatc atatttcaca aacagttgat attcataaag agaaagttgc aagaagagaa 600
attggtattt tgactaccaa taaaaacact tcaaggacac ataagattat tgctccagcc 660
aaccttgaac gaccagttcg ttatattaga aaacctattg actatacaat tctagatgat 720
attggacatg gagtaaagtg gttgcttaga tttaaggtga gtacccagaa catgaagatg 780
ggtgggctgc cgcgtacaac acctccaact cagaagcccc ctagtccccc tatgtcaggg 840
aaagggacac ttgggcggca ctccccctat cgcacactgg agccagtgcg tcctccagtg 900
gtaccaaatg attacgtacc tagcccaacc cgtaatatgg ctccctcgca gcagagccct 960
gtgaggacag cttctgtgaa tcaaagaaat cgaacttaca gcagcagtgg gagtagtgga 1020
gggagccacc caagtagtcg gagcagcagt cgagagaaca gtggaagtgg tagtgtgggg 1080
gttcctattg ctgttcctac tccatctcct cccagtgtct ttccagcccc tgctggctct 1140
gctggcactc ctccccttcc tgctacttct gcatctgccc ctgctcctct tgttcctgct 1200
actgtccctt cctccactgc cccagacgct gctgctgggg gtgcccagac ccttgctgat 1260
ggcttcactt ctccaactcc ccctgttgtt tcttccactc cccctacagg tcatcctgta 1320
cagttctaca gcatgaatag gcctgcctct cgccatactc ccccaacaat agggggctcg 1380
ttgccctata gacgccctcc ttccattact tcacaaacaa gccttcagaa tcagatgaat 1440
ggaggacctt tttatagcca gaatccagtt tcagatacac cacctccacc gccacctgtg 1500
gaagaaccag tctttgatga gtctccccca cctcctcctc ctccagaaga ttacgaagag 1560
gaggaagctg ctgtggttga gtatagtgat ccttatgctg aagaggaccc accgtgggct 1620
ccacgttctt acttggaaaa ggttgtggca atttatgact atacaaaaga caaggaagat 1680
gagctgtcct ttcaggaagg agccattatt tatgtcatca agaagaatga cgatggttgg 1740
tatgagggag ttatgaatgg agtgactggg ctttttcctg ggaattacgt tgagtctatc 1800
atgcattatt ctgagtaaag ctcagcaggg ctgtgcttgc ctcacaggaa tagtcaggtc 1860
ttcccagatt atctgaaggc cctggggatt ccactccagt aaagtagaat gaaggataca 1920
aatgataaaa attacacttt tttttttggt ttattcccca gtattaaaaa caaagcaagc 1980
tgagtctgaa caaatggatc tttctgccat catttgtaca atgctgagct gtctggattg 2040
aaataaaatg accattttta tgtatgtcaa aggtataaca gcataactgt gtagccaaaa 2100
caaaatcaga ttaagactga ttcagaaaaa tctgggatct ttctcaggaa tactgtatac 2160
ccttgggatt tctcctcctg cagaatctgt ggcattggat gttcttcatt gcctgtgcta 2220
aggggttaac ctcatggccc agtgggtacc ctagcccctt cttttcttcc acttgtatga 2280
agaggaggga accaacattt aaataccaca cttaaccatt tttacaatta tttcagatgg 2340
cttttttcct ctgtgacact gtaaattctg cattctctca gcacttgagt gcaccaaacg 2400
agtgaatgct gaactcactt gcatcccttc atgtttctgt ttgtggatta taaggatgat 2460
gaaatgtgaa agtctcccaa cactctgagg gtggtgaacg attgccaccc gtttgatttt 2520
aatgtgctgc tgcatgagac tgcattgttg ctaatggcca gtgtacccag atgtgaagtg 2580
tggtaggctg gttcatatgt ggaggtgggt gtgtgaagct agacacgaag gtccctaagg 2640
ttctgaagag acttgaactg tggaaatgct cttagcaggc atcccgaacc cctgcttcgg 2700
tgctgttttg aggagtagga tcttggagtt cagaccaact atgactatca tttccttcac 2760
tatctagaaa aacgctattc tactttggaa gagaatagta gttattttca agtctcctga 2820
cagtcactgg gagtacaagg tttgctaatg tgctctctgg acgttattaa tggccagtat 2880
tagttgctgc tgtattactg actcgcttag ctgtagaaag ggtaatactc tcctgatttt 2940
gtatgattgg actcttaagt agctgctgtt agtcagaatt aaaacccatc tcagactaag 3000
aatataatga ataagattaa taggccaaaa tatgtatcta atcacattga taaaaattaa 3060
tataactgac acaataaaac acatttcccc catctgtaca ataaatacag cttcaaattc 3120
agtggagtct gtagggcaga taactttaat catcactact gtagtcagta taagaaatgc 3180
tgaaaaaaat ccaggagggc ttgtctcttt gtgggtggtc actgtgatgt tgggccagct 3240
cctgttcagg tccagagctg ctaacgtggg ttctactcag tcccagtgac ttggccagaa 3300
tagagctttg ccaggtaact gccctgtgct aggtgaaagg ggaaaagcag tagctggata 3360
tatttcaaat gaggttttga acaagttcag aaagtggaac ttgattgaaa agtgaacaag 3420
tgtagtagtg tgtgagaaaa ttcagatggt gtcggatgca gaagttaata ttccacttaa 3480
tgttatctga gcattaaaaa tcatcagcat ttaactgaga ccccactata gagtttcctt 3540
atcaagactt tttggtttta aagttgtttt taatgcattg caagttacaa tagctatttt 3600
gcttttagat ttttcccagc actttgtatt tattagcttt cattaacttg cctccagtat 3660
acattccact tcgtgctttt cttaggtcat ttctacatcc cttattcctt gttttcctgc 3720
agtgtaatgg ccctgaatgt cctctgagcc ttcagctcca ttatggaccc aaactagact 3780
atacttggat aagttaagct cttcttcgtg tactggtcta taattagaaa aactgtttta 3840
aattagatgt tcccattatt tatttaaaca gctttttgct gagaaagctt agtggattaa 3900
tgaggcagag ggtgttttga aatccaataa atagttccca caggctgggt gtggtggctt 3960
atgcctgtaa tcccagcact ttcggaggcc gaggtgggtg gatcatgagg tcaataaatt 4020
gagaccatcc tggccaacat ggtgaaaccc catctctact aaaaacacaa aaattagctg 4080
ggcgtggtgg cgcacacctg tagtcccagc tacttgggag gctgaggcag gagaatcact 4140
ggaacctggg aggcagaggt tgcagtgagc cgagattgtg ccactgcact ccagcctggt 4200
gacagagcga gactccatca aaaaaaaaaa aaaaaagttc ccacagctca ccactacaga 4260
agcagggaag acaactatgc agaaaacaga gttagtggcg gtcagcagga atgcagctgg 4320
tcttttggac ccctacggga tgggggcagt gcagaagaca ctggtgaagt cctttatact 4380
gaagacctgt ggttgggagc aggggtagtc catgggtctg ctgatttttt ttccctattt 4440
agtactaatg tgtgtgtgat ctttgtttta caaacagtac cttttgggtt ttctgcatat 4500
tttataattt ttgtacagtt ttgaattcta tagattgtct tggaaggata ctgtgtgatg 4560
ggtcaggcac acagtaattg gagactttta atgtatgtaa tatttcatag attgcatgct 4620
attaatcatc tgtgagggta gtattttttg ttttattgta agtttccctc tttttttata 4680
aattaaaaga tggttggtat taggaatttc aaatgaatgc agaaaatctt acatgctgtg 4740
tactattaat attataacag acgatccaag tccaaaatct gaccaataaa gcaaccattt 4800
tatcaagata gagggattct aatgggagag gggattcttc cctcctgaag tttgtgtgtc 4860
cagtcccctt aaaaaaaatg aatagttgtc ttttcttgtc atattaatac tcgaaagtcc 4920
atggtggtat taatgaaagt acactttatt gttgcctttg aacttacggc caaggcaata 4980
aatcagaaac aaaaatagtg ccaatgtgtc aaaatcgaca tctgagagat tcagcctccc 5040
atttggaata aatatgaatc ttctaagcta tcttgtttaa tattttccat catttagcta 5100
cttcctatct ccctcagagg cgcctgctgt tcccatttta gagttgacag tggcctgcta 5160
attttgctat gttcctaaaa gttactgggt gtgagacatt ttcatcccct cctttttcct 5220
actgctggtg tttattatcc agctagacaa tattttatgc atatttaccg tgatgtctgg 5280
accgtacctg tgctccttgg cagtttatgt tgaagataac taaagatttt tctctttggg 5340
aggcatcaaa atgatggtag tttgctttta tctttttatg ttcattttct tttagtaggt 5400
gacctttctg cattaagaac tgtttttatc ttttactacc ttttcttttc tcctttgtgg 5460
agacagcatg acatgtcctg aaggtcacct ttgcctttga aaaaggtttg atggaggaat 5520
tcacaggtga ctgacaagtc tttgaaaaga atgggatctg ctcacttctg gtctttttgg 5580
ccgggaactc ctgattggtg ttaaggtggt aatttccccc atataagatt tagaatcact 5640
gagtttgagc tagatgaaat ttttaaaatt tctggttgtc tcattagact gatgaggtga 5700
gttttcttct tcatatgaac agctagttaa taacagcaga gttctcactc agtgctcagt 5760
acttaatttt ccactgcacc acaactgtct taactaaatg tgctgtattt ttctttaaaa 5820
gttaagagtt ctatttggtg ttttcaggaa tatacgtgaa aagacatgcc atgttttggt 5880
aaataccatc agagttgtgt aaaggcgtgt actaagtgca atcttaattt gtggaaataa 5940
tcttcattta cccctcctaa aactacactc agtataaaca ctttcccata aggtgtgtgc 6000
agtaaaaatg ttatattact ccaacactgg caggagcaca gcacagcagc cttattggag 6060
agagccttat aaaagtgatt aaatggaggc attgagctca ttacctttaa gtttactttg 6120
tgctgacctt tgttcctgtt ttgagaatct catataatta ttaaaaaaaa aaaacaatta 6180
aaacgaaacg gcggggccta gctgtgtata aatgatcctt gctgaatatc ttaaggtttt 6240
ttgtaagaaa aaagaaaaac caacaaaaaa agcttatttt cacattaaaa tgaaacctct 6300
tttgcaactt aagaattcta tggaaaagca gtttttatca tattttgtgt ccatgcacca 6360
tttttcttaa aatggcttac aaaaaagaat gtaaacaatt tgtgatctgg ccagttgtac 6420
ttttagctcc cagagggaga gttggtggta ttatgagttg agtaaaaacc atccagggga 6480
acttgaggga gcagtctgtt gccagtaatg ttccttgtgt gccattaaac cacctccaga 6540
tgagtggagg aacatcactt tttaattttt taattgtatt tggaattgtt gccgtgtact 6600
aagaacttga cctaaataaa atcccacaaa gtatattcaa aaaaaaa 6647
<210> 49
<211> 1072
<212> DNA
<213> 智人
<400> 49
gcgcgctgga aggacactga gtcaccaacc accgccatgg gccggaagcc accgccctcg 60
cgtcaactgc aatctagagc gcggcgcatc ccgtgagccc gcggggaact acgactcccg 120
gcatgctccg cggccaccgg aattaaccct tcagggctgg gggccgcgct atgccccgcc 180
ccctccccag ccccagacac ggaccccgca ggccaactgg ctccctgccc ctgcccccgc 240
cccttgacat cccagactcc ctggctattt aaacagagat gggtgccccc atccgcacac 300
tgtcctttgg ccaccggaca tcatgcctcc caagaaggat gttcccgtga agaaaccagc 360
agggccctcc atctccaaac ctgctgctaa gccagcagca gcaggggctc ctccagccaa 420
gaccaaagct gagccagctg tcccccaggc ccctcagaaa acccaggagc ctccagtcga 480
tctctccaaa gtggtgatcg agtttaacaa ggaccagctg gaggagttca aggaggcctt 540
cgagctgttt gaccgagtgg gggatggcaa gatcctgtac agccagtgtg gggacgtgat 600
gagggccctg ggccagaacc ccaccaacgc cgaggtgctc aaggtcctgg ggaaccccaa 660
gagtgatgag ctgaagtcgc ggcgtgtgga ctttgagact ttcctgccca tgctccaggc 720
agtggccaag aaccgaggcc aaggcacata tgaggactac ttggaggggt ttcgtgtgtt 780
tgacaaggag gggaacggca aagtcatggg agcagagctc agacatgttc tcaccaccct 840
tggagagaag atgactgagg aggaggtgga gaccgttctg gcaggacacg aggacagcaa 900
cggctgcatc aactacgagg ccttcttgaa acacatccta agcgtctgag tgctgcagat 960
ccagtggggt ccggacactg ggccccgcag gcgaaagcac gttccagcca ccaggaggcc 1020
acctattgtt tcaaaataaa gactgggttc ctctcttggt ttcaaaaaaa aa 1072
<210> 50
<211> 4997
<212> DNA
<213> 智人
<400> 50
agactctcgg tctgtccgct gggggcgcgc gcggtgtgtg gcaggcggca gcggcgctgg 60
cggccgagtg cgcttgtcac gcgtggcggt gcgtggttgc taggggcgcc tgaggctgcc 120
gggtagccca gcaggccgag ggaggaagta gcgtggagcc ggtgccgagc cggggcgaag 180
ctggatcccc tagatagact gtcttcaagc tcactgatat tttcctctgc ttgatccatt 240
gtgctgttga gagcctctag taaatttttc agactgacag acttcaagga tgcagctgct 300
actaccggag gtgtgtggca ccttacctca gcaaggccat gagaccgtgt ggccatgatg 360
tgggcccctc atggcctcag caggaacaca gcactatagt attggcctcc gccagaaaaa 420
cagcttcaag cagagtggtc cctcaggcac agtacctgcc acgccacctg agaaaccctc 480
ggagggcaga gtctggcctc aggcccatca gcaagtgaag ccaatctgga agctggaaaa 540
gaagcaagtg gagacactgt cagcagggtt gggcccaggc ctcttgggcg tcccacccca 600
gccagcatat ttcttttgcc ccagcacttt atgtagctct gggaccacgg ctgtcattgc 660
aggccacagc agttcctgtt acctacactc tctcccggac ttgttcaaca gcaccctgct 720
ataccgccgc tccagctata ggcaaaaacc gtaccagcaa ctggagtctt tctgcttgcg 780
ttcgagcccg tcagaaaaaa gccctttttc tctccctcaa aagagcctcc ctgtcagtct 840
cactgccaac aaggccactt cttccatggt cttctccatg gcccagccca tggcctcctc 900
atccacagaa ccatacctct gcttggcagc ggctggggaa aacccttcag ggaagagcct 960
ggcctctgcc atctcaggga agatcccatc tccactctct tcctcctata agcccatgct 1020
gaataataat tccttcatgt ggccaaatag cacgccagtg cctttattgc agaccacaca 1080
gggcctgaag ccagtatcgc cacccaagat ccagcctgtc tcctggcatc attcaggggg 1140
tactggagac tgtgcaccgc agcctgttga ccataaggtg cccaaaagca ttggcactgt 1200
cccagctgat gccagtgccc atatcgcctt gtctaccgct agctcccacg acacatccac 1260
caccagtgtt gcctcttcct ggtataaccg gaataactta gccatgaggg cagagccact 1320
ttcctgtgct ctggatgaca gctctgattc ccaggatcca actaaggaga ttcggttcac 1380
tgaggccgtg aggaaattga ccgcaagagg ctttgagaag atgccgaggc aaggctgcca 1440
gcttgaacag tctagtttcc tgaaccccag cttccagtgg aatgtcctca acaggagcag 1500
gcggtggaaa cctcctgcgg taaatcagca gtttcctcag gaggatgctg gatcggtcag 1560
gcgggtcctc cctggtgcct cagatacctt ggggttggac aatacagtct tctgtaccaa 1620
gcgtatcagc attcacctcc ttgcctcaca tgccagtggg ctcaatcaca accctgcctg 1680
tgaatctgta attgactcct cagcatttgg agaaggcaaa gctccaggtc ccccttttcc 1740
tcaaactctt ggcatagcca acgtggccac ccgcctctct tccatccagc tgggccagtc 1800
tgagaaggag agacctgagg aggccaggga gctggactca tctgataggg atattagttc 1860
agctactgac ctccagccag atcaggctga gactgaagat acagaagaag aactagtaga 1920
tggtttggaa gactgttgta gccgtgatga gaatgaagag gaggagggag actcagagtg 1980
ctcctcatta agtgctgtct cccccagcga atcggtggcc atgatctcta gaagctgtat 2040
ggaaattctg accaaacccc tttccaatca tgagaaagtt gtccgaccag ccctcatcta 2100
cagtctcttt cccaacgttc cccctaccat ctattttggc actcgggatg agagagtgga 2160
gaaacttccc tgggaacaga ggaagttgct ccgatggaag atgagcacag tgacccccaa 2220
cattgtcaag cagaccattg gacggtccca cttcaaaatc agcaaaagaa acgatgactg 2280
gctgggctgc tggggtcacc acatgaagtc tcctagtttc cgatccattc gagagcatca 2340
gaagctaaac catttcccag gctcattcca gattgggagg aaggaccggc tatggcggaa 2400
cctgtcacgt atgcagagcc gctttggcaa gaaggagttc agtttcttcc cccagtcctt 2460
tatcctgccc caggacgcca agctcctgcg caaagcgtgg gagagcagca gccgccaaaa 2520
gtggattgtg aagccaccag catcagctcg aggcattggc atccaggtta ttcacaagtg 2580
gagtcagctc cccaagcgaa ggcccctcct ggtacagagg tatctacaca aaccctacct 2640
catcagcggc agcaagtttg acctgcggat ctatgtttat gtcacttcct acgatcctct 2700
gcggatttac ctcttttcag atggactggt ccgctttgcc agttgcaagt attcgccttc 2760
catgaagagc cttggcaata agttcatgca cctgaccaac tacagtgtca ataaaaagaa 2820
tgccgagtac caggccaatg cagatgaaat ggcttgccag ggccacaaat gggcactgaa 2880
ggctttgtgg aactacctga gccagaaggg agtcaatagc gacgccatct gggagaagat 2940
aaaggatgtt gttgtcaaaa ctatcatctc gtcagagccc tatgtgacca gcctgctcaa 3000
gatgtatgtg cgacggccct atagctgcca tgaactcttt ggttttgaca tcatgctaga 3060
cgaaaacctc aagccctggg tcctggaagt caacatttcc ccaagcctcc actccagctc 3120
tccactggat atcagcatca aaggccagat gattcgtgac cttctgaatc tggcaggttt 3180
tgtcctgccc aatgcagagg atatcatttc cagccccagc agctgcagca gctccaccac 3240
cagcctgccc acctcccctg gggacaaatg tcgaatggct ccagagcatg tcactgcaca 3300
gaagatgaag aaagcctatt atctgaccca gaaaattcct gatcaggact tctatgcatc 3360
tgtgctggat gtcctgacac cagatgatgt tcggattctg gttgagatgg aagatgagtt 3420
ttctcgccgt ggtcagtttg aacgaatttt tccttctcat atctcctctc gctatctccg 3480
cttttttgag cagccacgat atttcaacat tctcaccacc caatgggaac agaaatacca 3540
tggcaacaag cttaaaggag tagatctgct ccggagttgg tgctacaaag ggttccacat 3600
gggagttgtc tctgattctg ctccagtgtg gtctctcccg acatcacttc tgactatctc 3660
aaaggatgac gtgatactca atgccttcag caaatcagag actagcaagc tgggaaaaca 3720
aagctcctgt gaggttagcc tactactctc tgaagacggg accacgccca aatccaagaa 3780
gactcaagct ggcctttccc cttatcccca gaaacccagt tcctcaaagg acagtgagga 3840
caccagcaaa gagcccagcc tttctaccca gacgttacct gtgatcaagt gctctgggca 3900
gacttcaaga ctttctgctt cctccacttt ccagtcaatc agtgactccc tcctggctgt 3960
gagcccataa ctggcctctc tccaaaagcc tctgcccagg agcatgggca tcagctacct 4020
cacgggaacc agcctgctgt tcagaccagt ctgaccccct acccctttca ccctgtccct 4080
cctcagagta ttttttgaag tggttgcatt atagagatgg gtatttgtag ggccggaggg 4140
atggtagtga tggggagaag gtgaggaagg gtcaccctct gtcacctgtc tgcctggctg 4200
gcacctcata tctcagcaga gaagccagtg gtggccacgc agccttataa agcaggtttt 4260
ggtttctacc ttaagtgagc catgtgtggt ttgtctgggg gccctggtgt ggttgctgag 4320
ttgtagctca agaggagaaa acatacagaa catatttgga ccggaaatcc tttgttctga 4380
atttgagggg gtcttctgag gtccttactt ccttaggtct ttcctcaccc ctctcccacc 4440
gctgtcctga ggagaaaccc ttgaacttcc tcagtagaca ggcggagagg ccacaacatg 4500
ccgaacccat ttcctgtcat cctagtcttg ggtcttcacc gcctccttcc aaatacccac 4560
cctgccagca gccctaggtc ttcctgttct gaccccccat cactgctcgt tcagccttct 4620
agatgtctct ctcgtggaca tctgttcttt agctgttggc tttctctgag gtgtgagagg 4680
gtctatgaac tttgtgaatt tcccatggcc ccagtgaagg agcccagata atcccagtag 4740
ctgttacctg tctccatgta tcaaaggaca cagtccaggg ggagggtgga aggagatgtg 4800
gtttctctat agtgcaacaa acatggtttc tcaatgttct gctgtgcagc aagcagggtc 4860
tggcggcttg gtaggtgggt ttcaggagca gtcactattg taggatgggc ttccaatcaa 4920
acctcagact aaactcttgt actgaactga ttctacctcc ctcctctaga ctcagtaaac 4980
agtgactatt caataaa 4997
<210> 51
<211> 4246
<212> DNA
<213> 智人
<400> 51
attgaacagt ccagatatac tgatttccag cccatatttc ctgcttttaa gctcctttgg 60
tcttatttcc ctcttctttc tgaaaagtta taaaatgaat gaagggcaga atgtttcttg 120
cccaaccatg attcaggagg cagctcagcc acagaacagg caagtgtagc attgcctgga 180
ggaaaaggac ttgtagaggc aggtcccaga tggatccacc ccagactttt caaagaagac 240
acctccttca tcttgtgttc taaaaccttg caagttcagg aagaaaccat ctgcatccat 300
attgaaaacc tgacacaatg tatgcagcag gctcagtgtg agtgaactgg aggcttctct 360
acaacatgac ccaaaggagc attgcaggtc ctatttgcaa cctgaagttt gtgactctcc 420
tggttgcctt aagttcagaa ctcccattcc tgggagctgg agtacagctt caagacaatg 480
ggtataatgg attgctcatt gcaattaatc ctcaggtacc tgagaatcag aacctcatct 540
caaacattaa ggaaatgata actgaagctt cattttacct atttaatgct accaagagaa 600
gagtattttt cagaaatata aagattttaa tacctgccac atggaaagct aataataaca 660
gcaaaataaa acaagaatca tatgaaaagg caaatgtcat agtgactgac tggtatgggg 720
cacatggaga tgatccatac accctacaat acagagggtg tggaaaagag ggaaaataca 780
ttcatttcac acctaatttc ctactgaatg ataacttaac agctggctac ggatcacgag 840
gccgagtgtt tgtccatgaa tgggcccacc tccgttgggg tgtgttcgat gagtataaca 900
atgacaaacc tttctacata aatgggcaaa atcaaattaa agtgacaagg tgttcatctg 960
acatcacagg catttttgtg tgtgaaaaag gtccttgccc ccaagaaaac tgtattatta 1020
gtaagctttt taaagaagga tgcaccttta tctacaatag cacccaaaat gcaactgcat 1080
caataatgtt catgcaaagt ttatcttctg tggttgaatt ttgtaatgca agtacccaca 1140
accaagaagc accaaaccta cagaaccaga tgtgcagcct cagaagtgca tgggatgtaa 1200
tcacagactc tgctgacttt caccacagct ttcccatgaa tgggactgag cttccacctc 1260
ctcccacatt ctcgcttgta caggctggtg acaaagtggt ctgtttagtg ctggatgtgt 1320
ccagcaagat ggcagaggct gacagactcc ttcaactaca acaagccgca gaattttatt 1380
tgatgcagat tgttgaaatt cataccttcg tgggcattgc cagtttcgac agcaaaggag 1440
agatcagagc ccagctacac caaattaaca gcaatgatga tcgaaagttg ctggtttcat 1500
atctgcccac cactgtatca gctaaaacag acatcagcat ttgttcaggg cttaagaaag 1560
gatttgaggt ggttgaaaaa ctgaatggaa aagcttatgg ctctgtgatg atattagtga 1620
ccagcggaga tgataagctt cttggcaatt gcttacccac tgtgctcagc agtggttcaa 1680
caattcactc cattgccctg ggttcatctg cagccccaaa tctggaggaa ttatcacgtc 1740
ttacaggagg tttaaagttc tttgttccag atatatcaaa ctccaatagc atgattgatg 1800
ctttcagtag aatttcctct ggaactggag acattttcca gcaacatatt cagcttgaaa 1860
gtacaggtga aaatgtcaaa cctcaccatc aattgaaaaa cacagtgact gtggataata 1920
ctgtgggcaa cgacactatg tttctagtta cgtggcaggc cagtggtcct cctgagatta 1980
tattatttga tcctgatgga cgaaaatact acacaaataa ttttatcacc aatctaactt 2040
ttcggacagc tagtctttgg attccaggaa cagctaagcc tgggcactgg acttacaccc 2100
tgaacaatac ccatcattct ctgcaagccc tgaaagtgac agtgacctct cgcgcctcca 2160
actcagctgt gcccccagcc actgtggaag cctttgtgga aagagacagc ctccattttc 2220
ctcatcctgt gatgatttat gccaatgtga aacagggatt ttatcccatt cttaatgcca 2280
ctgtcactgc cacagttgag ccagagactg gagatcctgt tacgctgaga ctccttgatg 2340
atggagcagg tgctgatgtt ataaaaaatg atggaattta ctcgaggtat tttttctcct 2400
ttgctgcaaa tggtagatat agcttgaaag tgcatgtcaa tcactctccc agcataagca 2460
ccccagccca ctctattcca gggagtcatg ctatgtatgt accaggttac acagcaaacg 2520
gtaatattca gatgaatgct ccaaggaaat cagtaggcag aaatgaggag gagcgaaagt 2580
ggggctttag ccgagtcagc tcaggaggct ccttttcagt gctgggagtt ccagctggcc 2640
cccaccctga tgtgtttcca ccatgcaaaa ttattgacct ggaagctgta aaagtagaag 2700
aggaattgac cctatcttgg acagcacctg gagaagactt tgatcagggc caggctacaa 2760
gctatgaaat aagaatgagt aaaagtctac agaatatcca agatgacttt aacaatgcta 2820
ttttagtaaa tacatcaaag cgaaatcctc agcaagctgg catcagggag atatttacgt 2880
tctcacccca aatttccacg aatggacctg aacatcagcc aaatggagaa acacatgaaa 2940
gccacagaat ttatgttgca atacgagcaa tggataggaa ctccttacag tctgctgtat 3000
ctaacattgc ccaggcgcct ctgtttattc cccccaattc tgatcctgta cctgccagag 3060
attatcttat attgaaagga gttttaacag caatgggttt gataggaatc atttgcctta 3120
ttatagttgt gacacatcat actttaagca ggaaaaagag agcagacaag aaagagaatg 3180
gaacaaaatt attataaata aatatccaaa gtgtcttcct tcttagatat aagacccatg 3240
gccttcgact acaaaaacat actaacaaag tcaaattaac atcaaaactg tattaaaatg 3300
cattgagttt ttgtacaata cagataagat ttttacatgg tagatcaaca aattcttttt 3360
gggggtagat tagaaaaccc ttacactttg gctatgaaca aataataaaa attattcttt 3420
aaagtaatgt ctttaaaggc aaagggaagg gtaaagtcgg accagtgtca aggaaagttt 3480
gttttattga ggtggaaaaa tagccccaag cagagaaaag gagggtaggt ctgcattata 3540
actgtctgtg tgaagcaatc atttagttac tttgattaat ttttcttttc tccttatctg 3600
tgcagaacag gttgcttgtt tacaactgaa gatcatgcta tattttatat atgaagcccc 3660
taatgcaaag ctctttacct cttgctattt tgttatatat attacagatg aaatctcact 3720
gctaatgctc agagatcttt tttcactgta agaggtaacc tttaacaata tgggtattac 3780
ctttgtctct tcataccggt tttatgacaa aggtctattg aatttatttg tttgtaagtt 3840
tctactccca tcaaagcagc tttctaagtt attgccttgg ttattatgga tgatagttat 3900
agcccttata atgccttaac taaggaagaa aagatgttat tctgagtttg ttttaataca 3960
tatatgaaca tatagtttta ttcaattaaa ccaaagaaga ggtcagcagg gagatactaa 4020
cctttggaaa tgattagctg gctctgtttt ttggttaaat aagagtcttt aatcctttct 4080
ccatcaagag ttacttacca agggcagggg aagggggata tagaggtcac aaggaaataa 4140
aaatcatctt tcatctttaa ttttactcct tcctcttatt tttttaaaag attatcgaac 4200
aataaaatca tttgcctttt taattaaaaa aaaaaaaaaa aaaaaa 4246
<210> 52
<211> 2220
<212> DNA
<213> 智人
<400> 52
gaacttcttt cctggcacag gactcactgt gccccttccc gctgtgggta caaggtctgc 60
cccccacccc agctctccaa agcccaccgg cctccctgga ggccgaggtc gacggcccgt 120
cgcaccggga gggggggctc ccaggggtgc cccacgcacg gtcaaggtcc cgcgccaagc 180
ggggaccggg ctgggccgga agcgggcacg gtactcgcgg caaactagcg tgggcgagtc 240
ctgattgcag tcggacctgc cgccgcggca cttaacagtt tgcagagtgc ttcccgcccc 300
tgatctcatt ggagccttcg gacagcccag cccatggcca ccgatgcccc catttcacgc 360
ctgaggaagc ggaggctcag acgggccacc agcccctccg gaggctggcc cgggagcgcc 420
tggcagcgtc gggtctagga gccggctccc tcctgctccc tcctccgcgc cgcccggggt 480
gtgcccgccg tctgtgtgca ccactgctga gcccagctcc ggcgccctcg cctctgctgt 540
gggccccggg gacgcggggt caggccaccg cgttggccag gccgctgcag gtaggcacgg 600
cccccaccag gcgccatgga ctggaagaca ctccaggccc tactgagcgg tgtgaacaag 660
tactccacag cgttcgggcg catctggctg tccgtggtgt tcgtcttccg ggtgctggta 720
tacgtggtgg ctgcagagcg cgtgtggggg gatgagcaga aggactttga ctgcaacacc 780
aagcagcccg gctgcaccaa cgtctgctac gacaactact tccccatctc caacatccgc 840
ctctgggccc tgcagctcat cttcgtcaca tgcccctcgc tgctggtcat cctgcacgtg 900
gcctaccgtg aggagcggga gcgccggcac cgccagaaac acggggacca gtgcgccaag 960
ctgtacgaca acgcaggcaa gaagcacgga ggcctgtggt ggacctacct gttcagcctc 1020
atcttcaagc tcatcattga gttcctcttc ctctacctgc tgcacactct ctggcatggc 1080
ttcaatatgc cgcgcctggt gcagtgtgcc aacgtggccc cctgccccaa catcgtggac 1140
tgctacattg cccgacctac cgagaagaaa atcttcacct acttcatggt gggcgcctcc 1200
gccgtctgca tcgtactcac catctgtgag ctctgctacc tcatctgcca cagggtcctg 1260
cgaggcctgc acaaggacaa gcctcgaggg ggttgcagcc cctcgtcctc cgccagccga 1320
gcttccacct gccgctgcca ccacaagctg gtggaggctg gggaggtgga tccagaccca 1380
ggcaataaca agctgcaggc ttcagcaccc aacctgaccc ccatctgacc acagggcagg 1440
ggtggggcaa catgcgggct gccaatggga catgcagggc ggtgtggcag gtggagaggt 1500
cctacagggg ctgagtgacc ccactctgag ttcactaagt tatgcaactt tcgttttggc 1560
agatattttt tgacactggg aactgggctg tctagccggg tataggtaac ccacaggccc 1620
agtgccagcc ctcaaaggac atagactttg aaacaagcga attaactatc tacgctgcct 1680
gcaaggggcc acttagggca ctgctagcag ggcttcaacc aggaagggat caacccagga 1740
agggatgatc aggagaggct tccctgagga cataatgtgt aagagaggtg agaagtgctc 1800
ccaagcagac acaacagcag cacagaggtc tggaggccac acaaaaagtg atgctcgccc 1860
tgggctagcc tcagcagacc taaggcatct ctactccctc cagaggagcc gcccagattc 1920
ctgcagtgga gaggaggtct tccagcagca gcaggtctgg agggctgaga atgaacctga 1980
ctagaggttc tggagatacc cagaggtccc ccaggtcatc acttggctca gtggaagccc 2040
tctttcccca aatcctactc cctcagcctc aggcagtggt gctcccatct tcctccccac 2100
aactgtgctc aggctggtgc cagcctttca gaccctgctc ccagggactt gggtggatgc 2160
gctgatagaa catcctcaag acagtttcct tgaaatcaat aaatactgtg ttttataaaa 2220
<210> 53
<211> 1521
<212> DNA
<213> 智人
<400> 53
ttacattagc aagagagcaa gttgttccag tagtcgcctg gcaggagaat ttgaaagggt 60
gccccaaagg acaatctcta aaggggtaag ggagatacct accttgtctg gtaggggaga 120
tgtttcgttt tcatgcttta ccagaaaatc cacttccctg ccgaccttag tttcaaagct 180
tattcttaat tagagacaag aaacctgttt caacttgaag acaccgtatg aggtgaatgg 240
acagccagcc accacaatga aagaaatcaa accaggaata acctatgctg aacccacgcc 300
tcaatcgtcc ccaagtgttt cctgacacgc atctttgctt acagtgcatc acaactgaag 360
aatggggttc aacttgacgc ttgcaaaatt accaaataac gagctgcacg gccaagagag 420
tcacaattca ggcaacagga gcgacgggcc aggaaagaac accacccttc acaatgaatt 480
tgacacaatt gtcttgccgg tgctttatct cattatattt gtggcaagca tcttgctgaa 540
tggtttagca gtgtggatct tcttccacat taggaataaa accagcttca tattctatct 600
caaaaacata gtggttgcag acctcataat gacgctgaca tttccatttc gaatagtcca 660
tgatgcagga tttggacctt ggtacttcaa gtttattctc tgcagataca cttcagtttt 720
gttttatgca aacatgtata cttccatcgt gttccttggg ctgataagca ttgatcgcta 780
tctgaaggtg gtcaagccat ttggggactc tcggatgtac agcataacct tcacgaaggt 840
tttatctgtt tgtgtttggg tgatcatggc tgttttgtct ttgccaaaca tcatcctaac 900
aaatggtcag ccaacagagg acaatatcca tgactgctca aaacttaaaa gtcctttggg 960
ggtcaaatgg catacggcag tcacctatgt gaacagctgc ttgtttgtgg ccgtgctggt 1020
gattctgatc ggatgttaca tagccatatc caggtacatc cacaaatcca gcaggcaatt 1080
cataagtcag tcaagccgaa agcgaaaaca taaccagagc atcagggttg ttgtggctgt 1140
gttttttacc tgctttctac catatcactt gtgcagaatt ccttttactt ttagtcactt 1200
agacaggctt ttagatgaat ctgcacaaaa aatcctatat tactgcaaag aaattacact 1260
tttcttgtct gcgtgtaatg tttgcctgga tccaataatt tactttttca tgtgtaggtc 1320
attttcaaga aggctgttca aaaaatcaaa tatcagaacc aggagtgaaa gcatcagatc 1380
actgcaaagt gtgagaagat cggaagttcg catatattat gattacactg atgtgtaggc 1440
cttttattgt ttgttggaat cgatatgtac aaagtgtaaa taaatgtttc ttttcattat 1500
ccttgcttga gcccatcaaa a 1521
<210> 54
<211> 1336
<212> DNA
<213> 智人
<400> 54
gagagacaca gagtccggca ttggtcccag gcagcagtta gcccgccgcc cgcctgtgtg 60
tccccagagc catggagaga gccagtctga tccagaaggc caagctggca gagcaggccg 120
aacgctatga ggacatggca gccttcatga aaggcgccgt ggagaagggc gaggagctct 180
cctgcgaaga gcgaaacctg ctctcagtag cctataagaa cgtggtgggc ggccagaggg 240
ctgcctggag ggtgctgtcc agtattgagc agaaaagcaa cgaggagggc tcggaggaga 300
aggggcccga ggtgcgtgag taccgggaga aggtggagac tgagctccag ggcgtgtgcg 360
acaccgtgct gggcctgctg gacagccacc tcatcaagga ggccggggac gccgagagcc 420
gggtcttcta cctgaagatg aagggtgact actaccgcta cctggccgag gtggccaccg 480
gtgacgacaa gaagcgcatc attgactcag cccggtcagc ctaccaggag gccatggaca 540
tcagcaagaa ggagatgccg cccaccaacc ccatccgcct gggcctggcc ctgaactttt 600
ccgtcttcca ctacgagatc gccaacagcc ccgaggaggc catctctctg gccaagacca 660
ctttcgacga ggccatggct gatctgcaca ccctcagcga ggactcctac aaagacagca 720
ccctcatcat gcagctgctg cgagacaacc tgacactgtg gacggccgac aacgccgggg 780
aagagggggg cgaggctccc caggagcccc agagctgagt gttgcccgcc accgccccgc 840
cctgccccct ccagtccccc accctgccga gaggactagt atggggtggg aggccccacc 900
cttctcccct aggcgctgtt cttgctccaa agggctccgt ggagagggac tggcagagct 960
gaggccacct ggggctgggg atcccactct tcttgcagct gttgagcgca cctaaccact 1020
ggtcatgccc ccacccctgc tctccgcacc cgcttcctcc cgaccccagg accaggctac 1080
ttctcccctc ctcttgcctc cctcctgccc ctgctgcctc tgatcgtagg aattgaggag 1140
tgtcccgcct tgtggctgag aactggacag tggcaggggc tggagatggg tgtgtgtgtg 1200
tgtgtgtgtg tgtgtgtgtg tgtgcgcgcg cgccagtgca agaccgagat tgagggaaag 1260
catgtctgct gggtgtgacc atgtttcctc tcaataaagt tcccctgtga cactcaaaaa 1320
aaaaaaaaaa aaaaaa 1336
<210> 55
<211> 838
<212> DNA
<213> 智人
<400> 55
tgctgtttgt ggaaaataaa gcattctata ggcggagcta gtgaacgcct cttttaaaac 60
acgagtctcc acacttccct gttcactttg gttccagcat cctgtccagc aaagaagcaa 120
tcagccaaaa tgatacctgg aggcttatct gaggccaaac ccgccactcc agaaatccag 180
gagattgttg ataaggttaa accacagctt gaagaaaaaa caaatgagac ttacggaaaa 240
ttggaagctg tgcagtataa aactcaagtt gttgctggaa caaattacta cattaaggta 300
cgagcaggtg ataataaata tatgcacttg aaagtattca aaagtcttcc cggacaaaat 360
gaggacttgg tacttactgg ataccaggtt gacaaaaaca aggatgacga gctgacgggc 420
ttttagcagc atgtacccaa agtgttctga ttccttcaac tggctactga gtcatgatcc 480
ttgctgataa atataaccat caataaagaa gcattctttt ccaaagaaat tatttcttca 540
attatttctc atttattgta ttaagcagaa attacctttt ctttctcaaa atcagtgtta 600
ttgctttaga gtataaactc catataaatt gatggcaatt ggaaatctta taaaaactag 660
tcaagcctaa tgcaactggc taaaggatag taccaccctc acccccacca taggcaggct 720
ggatcgtgga ctatcaattc accagcctcc ttgttccctg tggctgctga taacccaaca 780
ttccatctct accctcatac ttcaaaatta aatcaagtat tttacaaaaa aaaaaaaa 838
<210> 56
<211> 5561
<212> DNA
<213> 智人
<400> 56
aaagcagcag agacgctgca gagggctttt cttagacatc aactgcagac ggctggcagg 60
atagaagcag cggctcactt ggactttttc accagggaaa tcagagacaa tgatggggct 120
cttccccaga actacagggg ctctggccat cttcgtggtg gtcatattgg ttcatggaga 180
attgcgaata gagactaaag gtcaatatga tgaagaagag atgactatgc aacaagctaa 240
aagaaggcaa aaacgtgaat gggtgaaatt tgccaaaccc tgcagagaag gagaagataa 300
ctcaaaaaga aacccaattg ccaagattac ttcagattac caagcaaccc agaaaatcac 360
ctaccgaatc tctggagtgg gaatcgatca gccgcctttt ggaatctttg ttgttgacaa 420
aaacactgga gatattaaca taacagctat agtcgaccgg gaggaaactc caagcttcct 480
gatcacatgt cgggctctaa atgcccaagg actagatgta gagaaaccac ttatactaac 540
ggttaaaatt ttggatatta atgataatcc tccagtattt tcacaacaaa ttttcatggg 600
tgaaattgaa gaaaatagtg cctcaaactc actggtgatg atactaaatg ccacagatgc 660
agatgaacca aaccacttga attctaaaat tgccttcaaa attgtctctc aggaaccagc 720
aggcacaccc atgttcctcc taagcagaaa cactggggaa gtccgtactt tgaccaattc 780
tcttgaccga gagcaagcta gcagctatcg tctggttgtg agtggtgcag acaaagatgg 840
agaaggacta tcaactcaat gtgaatgtaa tattaaagtg aaagatgtca acgataactt 900
cccaatgttt agagactctc agtattcagc acgtattgaa gaaaatattt taagttctga 960
attacttcga tttcaagtaa cagatttgga tgaagagtac acagataatt ggcttgcagt 1020
atatttcttt acctctggga atgaaggaaa ttggtttgaa atacaaactg atcctagaac 1080
taatgaaggc atcctgaaag tggtgaaggc tctagattat gaacaactac aaagcgtgaa 1140
acttagtatt gctgtcaaaa acaaagctga atttcaccaa tcagttatct ctcgataccg 1200
agttcagtca accccagtca caattcaggt aataaatgta agagaaggaa ttgcattccg 1260
tcctgcttcc aagacattta ctgtgcaaaa aggcataagt agcaaaaaat tggtggatta 1320
tatcctggga acatatcaag ccatcgatga ggacactaac aaagctgcct caaatgtcaa 1380
atatgtcatg ggacgtaacg atggtggata cctaatgatt gattcaaaaa ctgctgaaat 1440
caaatttgtc aaaaatatga accgagattc tactttcata gttaacaaaa caatcacagc 1500
tgaggttctg gccatagatg aatacacggg taaaacttct acaggcacgg tatatgttag 1560
agtacccgat ttcaatgaca attgtccaac agctgtcctc gaaaaagatg cagtttgcag 1620
ttcttcacct tccgtggttg tctccgctag aacactgaat aatagataca ctggccccta 1680
tacatttgca ctggaagatc aacctgtaaa gttgcctgcc gtatggagta tcacaaccct 1740
caatgctacc tcggccctcc tcagagccca ggaacagata cctcctggag tataccacat 1800
ctccctggta cttacagaca gtcagaacaa tcggtgtgag atgccacgca gcttgacact 1860
ggaagtctgt cagtgtgaca acaggggcat ctgtggaact tcttacccaa ccacaagccc 1920
tgggaccagg tatggcaggc cgcactcagg gaggctgggg cctgccgcca tcggcctgct 1980
gctccttggt ctcctgctgc tgctgttggc cccccttctg ctgttgacct gtgactgtgg 2040
ggcaggttct actgggggag tgacaggtgg ttttatccca gttcctgatg gctcagaagg 2100
aacaattcat cagtggggaa ttgaaggagc ccatcctgaa gacaaggaaa tcacaaatat 2160
ttgtgtgcct cctgtaacag ccaatggagc cgatttcatg gaaagttctg aagtttgtac 2220
aaatacgtat gccagaggca cagcggtgga aggcacttca ggaatggaaa tgaccactaa 2280
gcttggagca gccactgaat ctggaggtgc tgcaggcttt gcaacaggga cagtgtcagg 2340
agctgcttca ggattcggag cagccactgg agttggcatc tgttcctcag ggcagtctgg 2400
aaccatgaga acaaggcatt ccactggagg aaccaataag gactacgctg atggggcgat 2460
aagcatgaat tttctggact cctacttttc tcagaaagca tttgcctgtg cggaggaaga 2520
cgatggccag gaagcaaatg actgcttgtt gatctatgat aatgaaggcg cagatgccac 2580
tggttctcct gtgggctccg tgggttgttg cagttttatt gctgatgacc tggatgacag 2640
cttcttggac tcacttggac ccaaatttaa aaaacttgca gagataagcc ttggtgttga 2700
tggtgaaggc aaagaagttc agccaccctc taaagacagc ggttatggga ttgaatcctg 2760
tggccatccc atagaagtcc agcagacagg atttgttaag tgccagactt tgtcaggaag 2820
tcaaggagct tctgctttgt ccacctctgg gtctgtccag ccagctgttt ccatccctga 2880
ccctctgcag catggtaact atttagtaac ggagacttac tcggcttctg gttccctcgt 2940
gcaaccttcc actgcaggct ttgatccact tctcacacaa aatgtgatag tgacagaaag 3000
ggtgatctgt cccatttcca gtgttcctgg caacctagct ggcccaacgc agctacgagg 3060
gtcacatact atgctctgta cagaggatcc ttgctcccgt ctaatatgac cagaatgagc 3120
tggaatacca cactgaccaa atctggatct ttggactaaa gtattcaaaa tagcatagca 3180
aagctcactg tattgggcta ataatttggc acttattagc ttctctcata aactgatcac 3240
gattataaat taaatgtttg ggttcatacc ccaaaagcaa tatgttgtca ctcctaattc 3300
tcaagtacta ttcaaattgt agtaaatctt aaagtttttc aaaaccctaa aatcatattc 3360
gccaggaaat tttcctaaac attcttaagc ttctattttt cccctgccaa aggaaggtgt 3420
ttatcatttt aaaatgcaat gtgatttagt ggattaagca ggagcgctgg ttcttgtctc 3480
cattgccttt tcttatatca ttgataatga tgtaagaatc acaaggggcc gggcgcggtg 3540
gctcacgcct gtaatcccag cactttggga ggccgaggca ggtggatcat gaggtcagga 3600
gatcgagacc atcctggcta acaaggtgaa accccgtctc tactaaaaat acaaaaaatt 3660
agccgggcgc agtggcgggc gcctgtagtc ccagctactc gggaggctga ggcaggagaa 3720
tggcatgaac ccgggaagcg gagcttgcag tgagccgaga ttgcgccact gcagtccgca 3780
gtccggcctg ggcgacagag cgagactccg tctcaaaaaa aaaaaaaaaa aaagaatcac 3840
aaggtatttg ctaaagcatt ttgagctgct tggaaaaagg gaagtagttg cagtagagtt 3900
tcttccatct tcttggtgct gggaagccat atatgtgtct tttactcaag ctaaggggta 3960
taagcttatg tgttgaattt gctacatcta tatttcacat attctcacaa taagagaatt 4020
ttgaaataga aatatcatag aacatttaag aaagtttagt ataaataata ttttgtgtgt 4080
tttaatccct ttgaagggat ctatccaaag aaaatatttt acactgagct ccttcctaca 4140
cgtctcagta acagatcctg tgttagtctt tgaaaatagc tcatttttta aatgtcagtg 4200
agtagatgta gcatacatat gatgtataat gacgtgtatt atgttaacaa tgtctgcaga 4260
ttttgtagga atacaaaaca tggccttttt tataagcaaa acgggccaat gactagaata 4320
acacataggg caatctgtga atatgtatta taagcagcat tccagaaaag tagttggtga 4380
aataattttc aagtcaaaaa gggatatgga aagggaatta tgagtaacct ctatttttta 4440
agccttgctt ttaaattaaa cagctacagc catttaagcc ttgaggataa taaagcttga 4500
gagtaataat gttaggttag caaaggttta gatgtatcac ttcatgcatg ctaccatgat 4560
agtaatgcag ctcttcgagt catttctggt cattcaagat attcaccctt ttgcccatag 4620
aaagcaccct acctcacctg cttactgaca ttgtcttagc tgatcacaag atcattatca 4680
gcctccatta ttccttactg tatataaaat acagagtttt atattttcct ttcttcgttt 4740
ttcaccatat tcaaaaccta aatttgtttt tgcagatgga atgcaaagta atcaagtgtt 4800
tgtgctttca cctagaaggg tgtggtcctg aaggaaagag gtcccctaaa tatcccccac 4860
cctggtgctc ctccctctcc ctggtaccct gactaccagg aagtcaggtg ctagagcagc 4920
tggagaagtg caggcagcct gtgcttccac agatgggggt gctgctgcaa caaggctttc 4980
aatgtgccca tcttaggtgg gagaagctag atcctgtgca gcagcctggt aagtcctgag 5040
gaggttccat tgctcttcct gctgctgtcc tttgcttctc aacggtggct cgctctacag 5100
tctagagcac atgcagctaa cttgtgcctc tgcttatgca tgagggttaa attaacaacc 5160
ataaccttca tttgaagttc aaaggtgtat tcaggatcct caaagcattt taaccttgcc 5220
gcttaaaacc caatttaccg tgaaatggga attttgctgc attgttaaac tgtagtggaa 5280
accatgctat agtaataaag gttatataag agagaaattg aaattaaatg tgtttttaaa 5340
tttcaaaaaa aaatcaatct ttaggatgac ttaaaaattg atttgccatg taaaatgtat 5400
ctgcattttt tacacaaaac ttgttttaag cataaaattt taaaactgta ctacttgatg 5460
tattatacat tttgaaccat atgtattaaa ccataaacag tataatgttg ttataataaa 5520
acaggcaata aatttataaa taaaagctga aaaaaaaaaa a 5561
<210> 57
<211> 2105
<212> DNA
<213> 智人
<400> 57
ggagcgcgcg ctctgggcgc cgggacgaca ctccagcccc gggggacccg ccgcccagct 60
cccgagggtg cggcagcctc tggccactca gccggggccg agagggagct gccgggcggg 120
caggcgccgc aggcacccgg cgggcagggc ggggcagggc aagacggccg cctccgcaag 180
tgccacccgg cccacccggt tctctccctt ctgcctggga cgtcagcgga cggggcgctc 240
gcgggccggg gctgtatggg gctcccgcgc gggtcgttct tctggctgct gctcctgctc 300
acggctgcct gctcggggct cctctttgcc ctgtacttct cggcggtgca gcggtacccg 360
gggccagcgg ccggagccag ggacaccaca tcatttgaag cattctttca atccaaggca 420
tcgaattctt ggacaggaaa gggccaggcc tgccgacacc tgcttcacct ggccattcag 480
cggcaccccc acttccgtgg cctgttcaat ctctccattc cagtgctgct gtggggggac 540
ctcttcaccc cagcgctctg ggaccgcctg agccaacaca aagccccgta tggctggcgg 600
gggctctctc accaagtcat cgcctccacc ctgagccttc tgaacggctc agagagtgcc 660
aagctgtttg ccccgcccag ggacacccct ccaaagtgta tccggtgtgc cgtggtgggc 720
aacggaggca ttctgaatgg gtcccgccag ggtcccaaca tcgatgccca tgactatgta 780
ttcagactca atggagctgt gatcaaaggc ttcgagcgcg atgtgggcac caagacttcc 840
ttctatggtt tcactgtgaa cacgatgaag aactccctcg tctcctactg gaatctgggc 900
ttcacctccg tgccacaagg acaggacctg cagtatatct tcatcccctc agacatccgc 960
gactatgtga tgctgagatc ggccattctg ggcgtgcctg tccctgaggg cctagataaa 1020
ggggacaggc cgcacgccta ttttggacca gaagcctctg ccagtaaatt caagctgcta 1080
catccggact tcatcagcta cctgacagaa aggttcttga aatcaaagtt gattaacaca 1140
cattttggag acctatatat gcctagtacc ggggctctca tgctgctgac agctttgcat 1200
acctgtgacc aggtcagtgc ctatggattc atcacaagca actactggaa attttccgac 1260
cactatttcg aacgaaaaat gaagccattg atattttatg caaaccacga tctgtccctg 1320
gaagctgccc tgtggaggga cctgcacaag gccggcatcc ttcagctgta ccagcgctga 1380
ccccaatgca ctgagccctt tgcttcttca agagttgcgg ccctgatcct ctcaagtggc 1440
caaaagcttt tttaactttt caatcttcac cttcccttgc caacagaggg cactggggtg 1500
aattcaagat tttcatcgag gtctgttcaa tataggacac cccagcttgt ccttggctca 1560
tccaagaact cttctgtatc taaaacaata catctcaatc ttggccaagg gaaaatggac 1620
tgctttgctg gattggcact gagcaacttt aggaaatgtc ggtggagtgt tcagcaagat 1680
cagacagcag tccaggtcaa aggcaaacac acacgctcca gcccaaatcc tcctggtggc 1740
acatcctacc ccagatgcta aagtgattca aggactccag gacacctctt aagagccttt 1800
ctaagaacat gataggctta cttctgctcc ataataaagt gggagaaaaa agccagaata 1860
taacttaaga ctagataact gcgtacatga tggaccattt tttttttttt ggctgggtag 1920
agaaatcata taaaacgcag gctgtttagc atggagatga ctctcagaac actgggaggg 1980
tctggcactt gatgggggtt agttgcttgg cagcctgcct gccactgagg gaagtcccat 2040
tagagatgta tcaccacctt gtcaccaaca ggatgatgtc accaggtaat aaaccttcat 2100
cctca 2105
<210> 58
<211> 1376
<212> DNA
<213> 智人
<400> 58
agcacacccg gcaggctctg tcctggaaac aggcttcaac gggcttcccc gaaaaccttc 60
cccgcttctg gatatgaaat tcaagctgct tgctgagtcc tattgccggc tgctgggagc 120
caggagagcc ctgaggagta gtcactcagt agcagctgac gcgtgggtcc accatgaact 180
ggagtatctt tgagggactc ctgagtgggg tcaacaagta ctccacagcc tttgggcgca 240
tctggctgtc tctggtcttc atcttccgcg tgctggtgta cctggtgacg gccgagcgtg 300
tgtggagtga tgaccacaag gacttcgact gcaatactcg ccagcccggc tgctccaacg 360
tctgctttga tgagttcttc cctgtgtccc atgtgcgcct ctgggccctg cagcttatcc 420
tggtgacatg cccctcactg ctcgtggtca tgcacgtggc ctaccgggag gttcaggaga 480
agaggcaccg agaagcccat ggggagaaca gtgggcgcct ctacctgaac cccggcaaga 540
agcggggtgg gctctggtgg acatatgtct gcagcctagt gttcaaggcg agcgtggaca 600
tcgcctttct ctatgtgttc cactcattct accccaaata tatcctccct cctgtggtca 660
agtgccacgc agatccatgt cccaatatag tggactgctt catctccaag ccctcagaga 720
agaacatttt caccctcttc atggtggcca cagctgccat ctgcatcctg ctcaacctcg 780
tggagctcat ctacctggtg agcaagagat gccacgagtg cctggcagca aggaaagctc 840
aagccatgtg cacaggtcat cacccccacg gtaccacctc ttcctgcaaa caagacgacc 900
tcctttcggg tgacctcatc tttctgggct cagacagtca tcctcctctc ttaccagacc 960
gcccccgaga ccatgtgaag aaaaccatct tgtgaggggc tgcctggact ggtctggcag 1020
gttgggcctg gatggggagg ctctagcatc tctcataggt gcaacctgag agtgggggag 1080
ctaagccatg aggtaggggc aggcaagaga gaggattcag acgctctggg agccagttcc 1140
tagtcctcaa ctccagccac ctgccccagc tcgacggcac tgggccagtt ccccctctgc 1200
tctgcagctc ggtttccttt tctagaatgg aaatagtgag ggccaatgcc cagggttgga 1260
gggaggaggg cgttcataga agaacacaca tgcgggcacc ttcatcgtgt gtggcccact 1320
gtcagaactt aataaaagtc aactcatttg ctggtaaaaa aaaaaaaaaa aaaaaa 1376
<210> 59
<211> 3549
<212> DNA
<213> 智人
<400> 59
atcattccag tttggcaact tcacttgtag ggctgtttta atcaagctgc ccaaagtccc 60
ccaatcactc ctggaataca cagagagagg cagcagcttg ctcagcggac aaggatgctg 120
ggcgtgaggg accaaggcct gccctgcact cgggcctcct ccagccagtg ctgaccaggg 180
acttctgacc tgctggccag ccaggacctg tgtggggagg ccctcctgct gccttggggt 240
gacaatctca gctccaggct acagggagac cgggaggatc acagagccag catgttacag 300
gatcctgaca gtgatcaacc tctgaacagc ctcgatgtca aacccctgcg caaaccccgt 360
atccccatgg agaccttcag aaaggtgggg atccccatca tcatagcact actgagcctg 420
gcgagtatca tcattgtggt tgtcctcatc aaggtgattc tggataaata ctacttcctc 480
tgcgggcagc ctctccactt catcccgagg aagcagctgt gtgacggaga gctggactgt 540
cccttggggg aggacgagga gcactgtgtc aagagcttcc ccgaagggcc tgcagtggca 600
gtccgcctct ccaaggaccg atccacactg caggtgctgg actcggccac agggaactgg 660
ttctctgcct gtttcgacaa cttcacagaa gctctcgctg agacagcctg taggcagatg 720
ggctacagca gcaaacccac tttcagagct gtggagattg gcccagacca ggatctggat 780
gttgttgaaa tcacagaaaa cagccaggag cttcgcatgc ggaactcaag tgggccctgt 840
ctctcaggct ccctggtctc cctgcactgt cttgcctgtg ggaagagcct gaagaccccc 900
cgtgtggtgg gtggggagga ggcctctgtg gattcttggc cttggcaggt cagcatccag 960
tacgacaaac agcacgtctg tggagggagc atcctggacc cccactgggt cctcacggca 1020
gcccactgct tcaggaaaca taccgatgtg ttcaactgga aggtgcgggc aggctcagac 1080
aaactgggca gcttcccatc cctggctgtg gccaagatca tcatcattga attcaacccc 1140
atgtacccca aagacaatga catcgccctc atgaagctgc agttcccact cactttctca 1200
ggcacagtca ggcccatctg tctgcccttc tttgatgagg agctcactcc agccacccca 1260
ctctggatca ttggatgggg ctttacgaag cagaatggag ggaagatgtc tgacatactg 1320
ctgcaggcgt cagtccaggt cattgacagc acacggtgca atgcagacga tgcgtaccag 1380
ggggaagtca ccgagaagat gatgtgtgca ggcatcccgg aagggggtgt ggacacctgc 1440
cagggtgaca gtggtgggcc cctgatgtac caatctgacc agtggcatgt ggtgggcatc 1500
gttagttggg gctatggctg cgggggcccg agcaccccag gagtatacac caaggtctca 1560
gcctatctca actggatcta caatgtctgg aaggctgagc tgtaatgctg ctgccccttt 1620
gcagtgctgg gagccgcttc cttcctgccc tgcccacctg gggatccccc aaagtcagac 1680
acagagcaag agtccccttg ggtacacccc tctgcccaca gcctcagcat ttcttggagc 1740
agcaaagggc ctcaattcct ataagagacc ctcgcagccc agaggcgccc agaggaagtc 1800
agcagcccta gctcggccac acttggtgct cccagcatcc cagggagaga cacagcccac 1860
tgaacaaggt ctcaggggta ttgctaagcc aagaaggaac tttcccacac tactgaatgg 1920
aagcaggctg tcttgtaaaa gcccagatca ctgtgggctg gagaggagaa ggaaagggtc 1980
tgcgccagcc ctgtccgtct tcacccatcc ccaagcctac tagagcaaga aaccagttgt 2040
aatataaaat gcactgccct actgttggta tgactaccgt tacctactgt tgtcattgtt 2100
attacagcta tggccactat tattaaagag ctgtgtaaca tctctggcat aggctagctg 2160
gaatgcttga taagaactga gctgggatga ttgaactttc attctttggc ttggggagaa 2220
aagaagtcct ggggaagcaa ttgagtctca aagtagaggc aggggaaaaa agagttaggg 2280
agaccagatc tgctgagtgg cagcaagagt gagctgcaga ttacagaaac cagggtgagc 2340
aagtttgagt cccacacagg gccttctccc tttgcctctt tccctccctc cctgcctgtg 2400
ataatcagcc aggagccagg gataacctat gacttgggaa agagatgagt taggcagtca 2460
agggtgacat tcaatcaggg atccacaagt ggctggaaag aaatgctggt cctgtgtcct 2520
aactttttcc gcctggagag ccctcagtgt ggcttcttac atttaaaaaa caaaaaggat 2580
cagctgccag gtgtgaggca gtccccaagc tgagttgtga ggatgtaagc atgaataagt 2640
ccctgcactc aaaatggtca aagaattaaa ccccatggac ttttttggca tctgtatgaa 2700
agcttgggtt ttctgaggac tgtcttgcta tagttaagtc agatcctaga tgaaatatac 2760
ttgttcatac tgtactaggt tcttaggaaa caacagaatt cctcaaatgc caaaaacaaa 2820
gaaaatagaa acccagaaaa caaaacaaaa taaaacaaaa ccatcagaac tgtgagtgga 2880
aactaaggtg atgatctggg agcaatacac taaaatcttg ggtcgagacc tatatgaagg 2940
ctggcagtgg agctaaacct ggacacactg aagacaaggg agctgaacca gggctcctac 3000
atgaagcagg gataactgat ggcagtaaat gtggtctcaa attgcagatg gtctggagga 3060
aaatttccca aatttagagc ctcaggattc ccaaagatcc tccaaatatg agctcacaat 3120
caaagatcag agacgttgaa aaataaaaaa caccttaagt gggcagcata aaaaacagct 3180
aatttagaac cccaaaggct tcagatgtca gaatattaga gacttatgat aataagcaat 3240
atttgcagag tatttgtatg tgccagacac tattgtaagt gcttcatcat gtactgattc 3300
atttaatact cacagaaatc tgtgagatgg gtattattct tatcctcact ctatggatta 3360
aaaaaactaa ggcacaaagt ggttaagctc cttgcctgag attatagact gtaagttgaa 3420
cgtgagcact tggaatacag agttcatgct gtaaactacc acactatagg gcctccaata 3480
tgataattta taaaatattt gaataaaaaa tgaatactag ttccacattt taaaaaaaaa 3540
aaaaaaaaa 3549
<210> 60
<211> 3309
<212> DNA
<213> 智人
<400> 60
ttcagcccct ctcccgggct gcgcctccgc actccgggcc cgggcagaag ggggtgcgcc 60
tcggccccac cacccaggga gcagccgagc tgaaaggccg ggaaccgcgg cttgcgggga 120
ccacagctcc cgaaagcgac gttcggccac cggaggagcg ggagccaagc aggcggagct 180
cggcgggaga ggtgcgggcc gaatccgagc cgagcggaga ggaatccggc agtagagagc 240
ggactccagc cggcggaccc tgcagccctc gcctgggaca gcggcgcgct gggcaggcgc 300
ccaagagagc atcgagcagc ggaacccgcg aagccggccc gcagccgcga cccgcgcagc 360
ctgccgctct cccgccgccg gtccgggcag catgaggcgc gcggcgctct ggctctggct 420
gtgcgcgctg gcgctgagcc tgcagccggc cctgccgcaa attgtggcta ctaatttgcc 480
ccctgaagat caagatggct ctggggatga ctctgacaac ttctccggct caggtgcagg 540
tgctttgcaa gatatcacct tgtcacagca gaccccctcc acttggaagg acacgcagct 600
cctgacggct attcccacgt ctccagaacc caccggcctg gaggctacag ctgcctccac 660
ctccaccctg ccggctggag aggggcccaa ggagggagag gctgtagtcc tgccagaagt 720
ggagcctggc ctcaccgccc gggagcagga ggccaccccc cgacccaggg agaccacaca 780
gctcccgacc actcatcagg cctcaacgac cacagccacc acggcccagg agcccgccac 840
ctcccacccc cacagggaca tgcagcctgg ccaccatgag acctcaaccc ctgcaggacc 900
cagccaagct gaccttcaca ctccccacac agaggatgga ggtccttctg ccaccgagag 960
ggctgctgag gatggagcct ccagtcagct cccagcagca gagggctctg gggagcagga 1020
cttcaccttt gaaacctcgg gggagaatac ggctgtagtg gccgtggagc ctgaccgccg 1080
gaaccagtcc ccagtggatc agggggccac gggggcctca cagggcctcc tggacaggaa 1140
agaggtgctg ggaggggtca ttgccggagg cctcgtgggg ctcatctttg ctgtgtgcct 1200
ggtgggtttc atgctgtacc gcatgaagaa gaaggacgaa ggcagctact ccttggagga 1260
gccgaaacaa gccaacggcg gggcctacca gaagcccacc aaacaggagg aattctatgc 1320
ctgacgcggg agccatgcgc cccctccgcc ctgccactca ctaggccccc acttgcctct 1380
tccttgaaga actgcaggcc ctggcctccc ctgccaccag gccacctccc cagcattcca 1440
gcccctctgg tcgctcctgc ccacggagtc gtggggtgtg ctgggagctc cactctgctt 1500
ctctgacttc tgcctggaga cttagggcac caggggtttc tcgcatagga cctttccacc 1560
acagccagca cctggcatcg caccattctg actcggtttc tccaaactga agcagcctct 1620
ccccaggtcc agctctggag gggaggggga tccgactgct ttggacctaa atggcctcat 1680
gtggctggaa gatcctgcgg gtggggcttg gggctcacac acctgtagca cttactggta 1740
ggaccaagca tcttgggggg gtggccgctg agtggcaggg gacaggagtc cactttgttt 1800
cgtggggagg tctaatctag atatcgactt gtttttgcac atgtttcctc tagttctttg 1860
ttcatagccc agtagacctt gttacttctg aggtaagtta agtaagttga ttcggtatcc 1920
ccccatcttg cttccctaat ctatggtcgg gagacagcat cagggttaag aagacttttt 1980
tttttttttt ttaaactagg agaaccaaat ctggaagcca aaatgtaggc ttagtttgtg 2040
tgttgtctct tgagtttgtc gctcatgtgt gcaacagggt atggactatc tgtctggtgg 2100
ccccgtttct ggtggtctgt tggcaggctg gccagtccag gctgccgtgg ggccgccgcc 2160
tctttcaagc agtcgtgcct gtgtccatgc gctcagggcc atgctgaggc ctgggccgct 2220
gccacgttgg agaagcccgt gtgagaagtg aatgctggga ctcagccttc agacagagag 2280
gactgtaggg agggcggcag gggcctggag atcctcctgc agaccacgcc cgtcctgcct 2340
gtggcgccgt ctccaggggc tgcttcctcc tggaaattga cgaggggtgt cttgggcaga 2400
gctggctctg agcgcctcca tccaaggcca ggttctccgt tagctcctgt ggccccaccc 2460
tgggccctgg gctggaatca ggaatatttt ccaaagagtg atagtctttt gcttttggca 2520
aaactctact taatccaatg ggtttttccc tgtacagtag attttccaaa tgtaataaac 2580
tttaatataa agtagtcctg tgaatgccac tgccttcgct tcttgcctct gtgctgtgtg 2640
tgacgtgacc ggacttttct gcaaacacca acatgttggg aaacttggct cgaatctctg 2700
tgccttcgtc tttcccatgg ggagggattc tggttccagg gtccctctgt gtatttgctt 2760
ttttgttttg gctgaaattc tcctggaggt cggtaggttc agccaaggtt ttataaggct 2820
gatgtcaatt tctgtgttgc caagctccaa gccccatctt ctaaatggca aaggaaggtg 2880
gatggcccca gcacagcttg acctgaggct gtggtcacag cggaggtgtg gagccgaggc 2940
ctaccccgca gacaccttgg acatcctcct cccacccggc tgcagaggcc agaggccccc 3000
agcccagggc tcctgcactt acttgcttat ttgacaacgt ttcagcgact ccgttggcca 3060
ctccgagagg tgggccagtc tgtggatcag agatgcacca ccaagccaag ggaacctgtg 3120
tccggtattc gatactgcga ctttctgcct ggagtgtatg actgcacatg actcgggggt 3180
ggggaaaggg gtcggctgac catgctcatc tgctggtccg tgggacggtg cccaagccag 3240
aggctgggtt catttgtgta acgacaataa acggtacttg tcatttcggg caaaaaaaaa 3300
aaaaaaaaa 3309
<210> 61
<211> 3973
<212> DNA
<213> 智人
<400> 61
cggacggggc cgccccgatg ggacgccgcg ctccggcccc tgcgcgccgc tgagccgagc 60
gccccccgct gccgagaccc ccgccgccac cgccagccgc tgccccctcg cccccgcccg 120
ggccgggagc ctcgtccccg tcccccggaa agctggattt ccgaggctgg aggcgcctgg 180
ccggctgggt ggggaccacc atgggcaacg cggccggcag cgccgagcag cccgcgggcc 240
ccgccgcgcc gccccccaag cagcccgcgc ctcccaagca gccgatgccc gcggccggag 300
agctggagga gaggttcaac cgcgccctga actgcatgaa cttgccccca gacaaggtcc 360
agctgctgag ccagtatgac aacgagaaga agtgggagct catctgtgat caggagcggt 420
ttcaagtcaa gaatcccccc gcagcctaca tccagaagct gaagagctat gtggatactg 480
gtggggtcag ccgaaaggta gcagctgatt ggatgtccaa cctggggttt aagaggcgag 540
ttcaggagtc cacgcaggtg ctacgggagc tggagacctc cctgaggacc aaccacattg 600
ggtgggtgca ggagttcctc aatgaagaga accgtggcct ggatgtgctg ctcgagtacc 660
tggcctttgc ccagtgctct gtcacgtatg acatggagag cacagacaac ggggcttcca 720
actcagagaa aaacaagccc ctggagcagt ctgtggaaga cctcagcaag ggtccaccct 780
cctccgtgcc caaaagccgc cacctgacca tcaagctgac cccagcccac agcaggaagg 840
ccctgcggaa ttcccgcatc gtcagccaga aggacgacgt ccacgtctgt attatgtgcc 900
tacgcgccat catgaactac cagtctggct tcagccttgt catgaaccac ccagcctgtg 960
tcaatgagat tgctctgagc ctcaacaaca agaaccccag aaccaaggct ctggtgctgg 1020
agctgctggc ggccgtgtgc ttggtgcggg gaggacatga catcatcctt gcagcctttg 1080
acaacttcaa ggaggtgtgt ggggagcagc accgctttga aaagctgatg gaatatttcc 1140
ggaatgagga cagcaacatc gacttcatgg tggcctgcat gcagttcatc aacattgtgg 1200
tacattcggt ggagaacatg aacttccgtg tcttcctgca atatgagttc acccacttgg 1260
gcctggacct gtacttggag aggcttcggc tcaccgagag tgacaagctg caggtgcaga 1320
tccaggcgta cctggacaat atttttgatg tgggggcgct gctggaggac acagagacca 1380
agaacgctgt gctggagcac atggaggaac tgcaggagca agtggcgctg ctgacagagc 1440
ggcttcggga cgcggagaac gaatccatgg ccaagattgc agaactggaa aaacagctaa 1500
gccaggcgcg caaggagttg gagaccctgc gggagcgctt cagcgaatcg accgccatgg 1560
gcgcctccag gcgtccccca gagcctgaga aagcgcctcc cgctgccccg acgcggccct 1620
cggccctgga gctgaaggtg gaggagctgg aggagaaggg gttaatccgt attctgcggg 1680
ggccggggga tgctgtctcc atcgagatcc tccccgtcgc tgtggcaact ccgagcggcg 1740
gtgatgctcc gactccgggg gtgccgaccg gctcccccag cccagatctc gcacctgcag 1800
cagagccggc tcccggagca gcgccaccgc cgccgccccc actgcccggc ctcccctccc 1860
cgcaggaagc cccgccctct gcgcccccac aggccccgcc tctccctggc agcccggagc 1920
ccccgcctgc gccgccgctg cccggagacc tgccgccccc acccccgcca ccgccaccac 1980
ctccgggcac tgacgggccg gtgcctccgc cgccgccgcc gccgccgccg cctcccggag 2040
gtcctcctga tgccctagga agacgcgact cagaattggg cccaggagtg aaggccaaga 2100
agcccatcca gactaagttc cgaatgccac tcttgaactg ggtggcactg aaacccagcc 2160
agatcaccgg cactgtcttc acagagctca atgatgagaa ggtgctgcag gagctagaca 2220
tgagtgattt tgaggaacag ttcaagacca agtcccaagg ccccagcctg gacctcagcg 2280
ctctcaagag taaggcagcc cagaaggccc ccagcaaggc gacactcatt gaggccaacc 2340
gggccaagaa cttggccatc accctgcgga agggcaacct gggggccgag cgcatctgcc 2400
aagccattga ggcgtacgac ctgcaggctc tgggcctgga cttcctggag ctgctgatgc 2460
gcttcctgcc cacagagtat gagcgcagcc tcatcacccg ctttgagcgg gagcagcggc 2520
caatggagga gctgtcagag gaggaccgct tcatgctatg cttcagccgc atcccgcgcc 2580
tgccggagcg catgaccaca ctcaccttcc tgggcaactt cccggacaca gcccagctgc 2640
tcatgccgca actgaatgcc atcattgcag cctcaatgtc catcaagtcc tctgacaaac 2700
tccgccagat cctggagatt gtcctggcct ttggcaacta catgaacagt agcaagcgtg 2760
gggcagccta tggcttccgg ctccagagcc tggatgcgct gttggagatg aagtcgactg 2820
atcgcaagca gacgctgctg cactacctgg tgaaggtcat tgctgagaag tacccgcaac 2880
tcacaggctt ccacagcgac ctgcacttcc tggacaaggc gggctcagtg tccctggaca 2940
gtgtcctggc ggacgtgcgc tccctgcagc gaggcctaga gttgacacag agagagtttg 3000
tgcggcagga tgactgcatg gtgctcaagg agttcctgag ggccaactcg cccaccatgg 3060
acaagctgct ggcagacagc aagacggctc aggaggcctt tgagtctgtg gtggagtact 3120
tcggagagaa ccccaagacc acatccccag gcctgttctt ctccctcttt agccgcttca 3180
ttaaggccta caagaaagct gagcaggagg tggaacagtg gaaaaaagaa gccgctgccc 3240
aggaggcagg cgctgatacc ccgggcaaag gggagccccc agcacccaag tcaccgccaa 3300
aggcccggcg gccacagatg gacctcatct ctgagctgaa acggaggcag cagaaggagc 3360
cactcattta tgagagcgac cgtgatgggg ccattgaaga catcatcaca gtgatcaaga 3420
cggtgccctt cacggcccgc accggcaagc ggacatcccg gctcctctgt gaggccagcc 3480
tgggagaaga gatgcccctc tagcccctca gatctgcgga accagcccta catccgcgca 3540
gacacaggcc gccgcagtgc ccgtcggcgt cccccgggcc ccccactgca ggtcacctcc 3600
gacctctcgc tgtagccgct atttctgcag gtggattctg caggggtgtg gggccgtgga 3660
caggctgagg ctcaaggaag gtggtcctca gctcggctgg ccgggcagcc cctcctccgc 3720
tgtggcccgc ctcaaacggg ctggtgcatc ctcctcttgg ccacagaggg cagcatcgcc 3780
cgccccttcc cccaaatgct gcttgcagca cccaccctaa agccccctcc aaatagccat 3840
acttagcctc agcaggagcc tggcctgtaa cttataaagt gcacctcgcc cccgcaagcc 3900
ccagccccga ggaccgtcca tggaccttat ttttatatga gattaataaa gatgtttgca 3960
aaaaaaaaaa aaa 3973
<210> 62
<211> 6932
<212> DNA
<213> 智人
<400> 62
gcatttaaaa gacagcgtga gactcgcgcc ctccggcacg gaaaaggcca ggcgacaggt 60
gtcgcttgaa aagactgggc ttgtccttgc tggtgcatgc gtcgtcggcc tctgggcagc 120
aggtttacaa aggaggaaaa cgacttcttc tagatttttt tttcagtttc ttctataaat 180
caaaacatct caaaatggag acctaaaatc cttaaaggga cttagtctaa tctcgggagg 240
tagttttgtg catgggtaaa caaattaagt attaactggt gttttactat ccaaagaatg 300
ctaattttat aaacatgatc gagttatata aggtatacca taatgagttt gattttgaat 360
ttgatttgtg gaaataaagg aaaagtgatt ctagctgggg catattgtta aagcattttt 420
ttcagagttg gccaggcagt ctcctactgg cacattctcc cattatgtag aatagaaata 480
gtacctgtgt ttgggaaaga ttttaaaatg agtgacagtt atttggaaca aagagctaat 540
aatcaatcca ctgcaaatta aagaaacatg cagatgaaag ttttgacaca ttaaaatact 600
tctacagtga caaagaaaaa tcaagaacaa agctttttga tatgtgcaac aaatttagag 660
gaagtaaaaa gataaatgtg atgattggtc aagaaattat ccagttattt acaaggccac 720
tgatatttta aacgtccaaa agtttgttta aatgggctgt taccgctgag aatgatgagg 780
atgagaatga tggttgaagg ttacatttta ggaaatgaag aaacttagaa aattaatata 840
aagacagtga tgaatacaaa gaagattttt ataacaatgt gtaaaatttt tggccaggga 900
aaggaatatt gaagttagat acaattactt acctttgagg gaaataattg ttggtaatga 960
gatgtgatgt ttctcctgcc acctggaaac aaagcattga agtctgcagt tgaaaagccc 1020
aacgtctgtg agatccagga aaccatgctt gcaaaccact ggtaaaaaaa aaaaaaaaaa 1080
aaaaaaaaag ccacagtgac ttgcttattg gtcattgcta gtattatcga ctcagaacct 1140
ctttactaat ggctagtaaa tcataattga gaaattctga attttgacaa ggtctctgct 1200
gttgaaatgg taaatttatt attttttttg tcatgataaa ttctggttca aggtatgcta 1260
tccatgaaat aatttctgac caaaactaaa ttgatgcaat ttgattatcc atcttagcct 1320
acagatggca tctggtaact tttgactgtt ttaaaaaata aatccactat cagagtagat 1380
ttgatgttgg cttcagaaac atttagaaaa acaaaagttc aaaaatgttt tcaggaggtg 1440
ataagttgaa taactctaca atgttagttc tttgaggggg acaaaaaatt taaaatcttt 1500
gaaaggtctt attttacagc catatctaaa ttatcttaag aaaattttta acaaagggaa 1560
tgaaatatat atcatgattc tgtttttcca aaagtaacct gaatatagca atgaagttca 1620
gttttgttat tggtagtttg ggcagagtct ctttttgcag cacctgttgt ctaccataat 1680
tacagaggac atttccatgt tctagccaag tatactatta gaataaaaaa acttaacatt 1740
gagttgcttc aacagcatga aactgagtcc aaaagaccaa atgaacaaac acattaatct 1800
ctgattattt attttaaata gaatatttaa ttgtgtaaga tctaatagta tcattatact 1860
taagcaatca tattcctgat gatctatggg aaataactat tatttaatta atattgaaac 1920
caggttttaa gatgtgttag ccagtcctgt tactagtaaa tctctttatt tggagagaaa 1980
ttttagattg ttttgttctc cttattagaa ggattgtaga aagaaaaaaa tgactaattg 2040
gagaaaaatt ggggatatat catatttcac tgaattcaaa atgtcttcag ttgtaaatct 2100
taccattatt ttacgtacct ctaagaaata aaagtgcttc taattaaaat atgatgtcat 2160
taattatgaa atacttcttg ataacagaag ttttaaaata gccatcttag aatcagtgaa 2220
atatggtaat gtattatttt cctcctttga gttaggtctt gtgctttttt ttcctggcca 2280
ctaaatttca caatttccaa aaagcaaaat aaacatattc tgaatatttt tgctgtgaaa 2340
cacttgacag cagagctttc caccatgaaa agaagcttca tgagtcacac attacatctt 2400
tgggttgatt gaatgccact gaaacattct agtagcctgg agaagttgac ctacctgtgg 2460
agatgcctgc cattaaatgg catcctgatg gcttaataca catcactctt ctgtgaaggg 2520
ttttaatttt caacacagct tactctgtag catcatgttt acattgtatg tataaagatt 2580
atacaaaggt gcaattgtgt atttcttcct taaaatgtat cagtatagga tttagaatct 2640
ccatgttgaa actctaaatg catagaaata aaaataataa aaaatttttc attttggctt 2700
ttcagcctag tattaaaact gataaaagca aagccatgca caaaactacc tccctagaga 2760
aaggctagtc ccttttcttc cccattcatt tcattatgaa catagtagaa aacagcatat 2820
tcttatcaaa tttgatgaaa agcgccaaca cgtttgaact gaaatacgac ttgtcatgtg 2880
aactgtaccg aatgtctacg tattccactt ttcctgctgg ggttcctgtc tcagaaagga 2940
gtcttgctcg tgctggtttc tattacactg gtgtgaatga caaggtcaaa tgcttctgtt 3000
gtggcctgat gctggataac tggaaaagag gagacagtcc tactgaaaag cataaaaagt 3060
tgtatcctag ctgcagattc gttcagagtc taaattccgt taacaacttg gaagctacct 3120
ctcagcctac ttttccttct tcagtaacaa attccacaca ctcattactt ccgggtacag 3180
aaaacagtgg atatttccgt ggctcttatt caaactctcc atcaaatcct gtaaactcca 3240
gagcaaatca agatttttct gccttgatga gaagttccta ccactgtgca atgaataacg 3300
aaaatgccag attacttact tttcagacat ggccattgac ttttctgtcg ccaacagatc 3360
tggcaaaagc aggcttttac tacataggac ctggagacag agtggcttgc tttgcctgtg 3420
gtggaaaatt gagcaattgg gaaccgaagg ataatgctat gtcagaacac ctgagacatt 3480
ttcccaaatg cccatttata gaaaatcagc ttcaagacac ttcaagatac acagtttcta 3540
atctgagcat gcagacacat gcagcccgct ttaaaacatt ctttaactgg ccctctagtg 3600
ttctagttaa tcctgagcag cttgcaagtg cgggttttta ttatgtgggt aacagtgatg 3660
atgtcaaatg cttttgctgt gatggtggac tcaggtgttg ggaatctgga gatgatccat 3720
gggttcaaca tgccaagtgg tttccaaggt gtgagtactt gataagaatt aaaggacagg 3780
agttcatccg tcaagttcaa gccagttacc ctcatctact tgaacagctg ctatccacat 3840
cagacagccc aggagatgaa aatgcagagt catcaattat ccattttgaa cctggagaag 3900
accattcaga agatgcaatc atgatgaata ctcctgtgat taatgctgcc gtggaaatgg 3960
gctttagtag aagcctggta aaacagacag ttcagagaaa aatcctagca actggagaga 4020
attatagact agtcaatgat cttgtgttag acttactcaa tgcagaagat gaaataaggg 4080
aagaggagag agaaagagca actgaggaaa aagaatcaaa tgatttatta ttaatccgga 4140
agaatagaat ggcacttttt caacatttga cttgtgtaat tccaatcctg gatagtctac 4200
taactgccgg aattattaat gaacaagaac atgatgttat taaacagaag acacagacgt 4260
ctttacaagc aagagaactg attgatacga ttttagtaaa aggaaatatt gcagccactg 4320
tattcagaaa ctctctgcaa gaagctgaag ctgtgttata tgagcattta tttgtgcaac 4380
aggacataaa atatattccc acagaagatg tttcagatct accagtggaa gaacaattgc 4440
ggagactaca agaagaaaga acatgtaaag tgtgtatgga caaagaagtg tccatagtgt 4500
ttattccttg tggtcatcta gtagtatgca aagattgtgc tccttcttta agaaagtgtc 4560
ctatttgtag gagtacaatc aagggtacag ttcgtacatt tctttcatga agaagaacca 4620
aaacatcgtc taaactttag aattaattta ttaaatgtat tataacttta acttttatcc 4680
taatttggtt tccttaaaat ttttatttat ttacaactca aaaaacattg ttttgtgtaa 4740
catatttata tatgtatcta aaccatatga acatatattt tttagaaact aagagaatga 4800
taggcttttg ttcttatgaa cgaaaaagag gtagcactac aaacacaata ttcaatcaaa 4860
atttcagcat tattgaaatt gtaagtgaag taaaacttaa gatatttgag ttaaccttta 4920
agaattttaa atattttggc attgtactaa taccgggaac atgaagccag gtgtggtggt 4980
atgtgcctgt agtcccaggc tgaggcaaga gaattacttg agcccaggag tttgaatcca 5040
tcctgggcag catactgaga ccctgccttt aaaaacaaac agaacaaaaa caaaacacca 5100
gggacacatt tctctgtctt ttttgatcag tgtcctatac atcgaaggtg tgcatatatg 5160
ttgaatgaca ttttagggac atggtgtttt tataaagaat tctgtgagaa aaaatttaat 5220
aaagcaacaa aaattactct tattcttcat tgctttattt caatgacatt ggatagttta 5280
gtcactccca gactctttcc ataccttctt aaagcctctc aaatattgaa ctacagttta 5340
tactccttcc cataagatgc ttcttcattg acacttgtag aacacggggt caacacatca 5400
taaaatctat tatggaatgc ctgagacaag aatcaaacag tccctttagt aagtttgttt 5460
attcacttct ctattgattc attcaagaag tctcatgcca gccccaccta ttggaagaag 5520
gtctgagttt tattcttatc tctttggtat taattctgaa acttagaaag tacactggtt 5580
agcaatgctt gggaccaaca ggttgttctg gtaaataaat ctgtttcata ttgtcagtgc 5640
aacaaaatgt ccccctctgc attatgttat tggtactcaa cacgtccgag tcataactct 5700
gtcctttgct tcttatagag gtattaggtc ttcaagagca gaagtaagac tgtaataggg 5760
aatactcagg ggaaggcagg caaaggctag tcatctaaac cagttctaga tgtctgtata 5820
ggggcagatg gctctgtaag ggcagaaggg aaagacccct tcataagggt cacagctgac 5880
aatcctataa caaaagacag gttaacaaga gaaaaactta acaaatttat ttaatcacag 5940
atttacatca ccggggagcc ttcgtaatga agatccaaaa ttacagggga aactgtgcat 6000
ttttatgctt aggtttgata atgaatggac agccctgaag aatagtgatt ggaaaaaaag 6060
gatatgatct aatgggaata gacacaggtt ggggacccag caaggcctgt ctgttcagat 6120
tattcttggt ctctgtgcag cattccttcc tcctggatat agggcagggc ctgtatggga 6180
tggggatatt ataacctgct atcaagcaag gtaggtcaga gaatttattt atggccagct 6240
cttacatagt taggtgagga aagattagag tactatcttt aagatgtaag tctggcattg 6300
tggaaagatg gttccagttt ctatgaccta ccttggggaa gaggaattca agtttctgtg 6360
gcttgccttc agggagaatg aggctgagac aggagggcag gataacatca gagaaaaact 6420
ttgcttctga ggccttcact ttgggttttc tgagccccaa catctgctag tgttgtaaag 6480
agaacaatta gggaccaagt gaggggagga aagaatccat ctctgcattc tgatgctggg 6540
agacttattt ccttgaaatg caattgattt tgcctctgct aagaggctct gctggctacc 6600
catgtactag ccagtgtcct gcatgggtgc taggctgaat tatttgtaat tgtgcttagg 6660
tgatttgtaa ctcaggtata gggtatttaa atagtaggca ccctttttgc accatgtgtt 6720
ttttttttta tctagttctt gtatactaca gataatattt gaactttgtc atctcactgt 6780
aaaacttttg ttcatttctc attatggtaa taaatagcta ttataaccaa cccatttatt 6840
caaatatgtt atttccctaa gtgttatttt gacattttgt tttggaaaaa ataaatcacc 6900
atagataata aaaaaaaaaa aaaaaaaaaa aa 6932
<210> 63
<211> 1375
<212> DNA
<213> 智人
<400> 63
cgggctgtca tgctcgcaca tgtgccatta attgacaaga atgctgctca agttggctga 60
tcaagagata ggcagtgcaa aggaacagga tttgagacag cccagggttt cctcttcaag 120
taggtctaaa acattttttt ttctcattga cttccttcct gttctaactg ccagtactca 180
gaagtcagag ttgagagaca gaggcacccc ggacagagac gtgaagcact gaataaatag 240
atcagaatga ctgaaaaagc cccagagcca catgtggagg aggatgacga tgatgagctg 300
gacagcaagc tcaattataa gcctccacca cagaagtccc tgaaagagct gcaggaaatg 360
gacaaagatg atgagagtct aattaagtac aagaaaacgc tgctgggaga tggtcctgtg 420
gtgacagatc cgaaagcccc caatgtcgtt gtcacccggc tcaccctggt ttgtgagagt 480
gccccgggac caatcaccat ggaccttact ggagatctgg aagccctcaa aaaggaaacc 540
attgtgttaa aggaaggttc tgaatataga gtcaaaattc acttcaaagt gaacagggat 600
attgtgtcag gcctgaaata cgttcagcac acctacagga ctggggtgaa agtggataaa 660
gcaacattta tggttggcag ctatggacct cggcctgagg agtatgagtt cctcactcca 720
gttgaggagg ctcccaaggg catgctggcg cgaggcacgt accacaacaa gtccttcttc 780
accgacgatg acaagcaaga ccacctcagc tgggagtgga acctgtcgat taagaaggag 840
tggacagaat gaatgcatcc acccctttcc ccacccttgc cacctggaag aattctctca 900
ggcgtgttca gcaccctgtc cctcctccct gtccacagct gggtccctct tcaacactgc 960
cacatttcct tattgatgca tcttttccca ccctgtcact caacgtggtc cctagaacaa 1020
gaggcttaaa accgggcttt cacccaacct gctccctctg atcctccatc agggccagat 1080
cttccacgtc tccatctcag tacacaatca tttaatattt ccctgtctta cccctattca 1140
agcaactaga ggccagaaaa tgggcaaatt atcactaaca ggtctttgac tcaggttcca 1200
gtagttcatt ctaatgccta gattcttttg tggttgttgc tggcccaatg agtccctagt 1260
cacatcccct gccagaggga gttcttcttt tgtgagagac actgtaaacg acacaagaga 1320
acaagaataa aacaataact gtgtgtgttc tggctgagaa aaaaaaaaaa aaaaa 1375
<210> 64
<211> 5425
<212> DNA
<213> 智人
<400> 64
cccgggccac cgcctccgcc cggctgcccg cccggactgt cgcggcccgc ggtggcgacg 60
gcggccgctg caaagtttcc ccggcggcgg cggcccgggg gcgcatcctc ccgcaactgt 120
caagcgctgg cggcggaaat gatgaggcgc tggccatttt ccgagcccgg gtttcctgcc 180
tgagccccgc tcgagcgagc cgcgagcgag gagccggcgg gcgggagagg acgcgcccag 240
ggcgggggcc cgcccgcccc ctcgggattt cgagggcccg ggggcgcgcg acgccatggg 300
ccggccgggc ccagagctcc tgtctctcag cccggccgca ccacctgggt ctccgccatg 360
aacgggcctg ccctgcagcc ctcctcgccc tcttccgcgc cctcagcctc cccggcggcg 420
gccccgcggg gctggagcga gttctgtgag ttgcacgccg tagcggcggc ccgggagctg 480
gcccgccagt actggctgtt cgcccgggag catccgcagc acgcgccgct gcgcgccgag 540
ctggtgtcgc tgcagttcac cgacctcttc cagcgctact tctgccgcga ggtgcgcgac 600
ggacgggcgc cgggccgcga ctaccgggac acaggccgtg ggcccccagc caaggccgag 660
gcgtccccgg agccaggccc cggccccgcc gcccctggcc tgcccaaggc ccgcagctct 720
gaggagctgg ccccgccgcg gccgcccggg ccctgctcct tccagcactt tcgccgcagc 780
ctccgccaca tcttccgccg ccgctcggcc ggggagctgc cagcggccca caccgctgcc 840
gcccccggga cccccggaga ggctgctgag acccccgccc ggcctggcct ggccaagaag 900
ttcctgccct ggagcctggc ccgggagccg ccacccgagg cgctgaagga ggcggtgctg 960
cgctacagcc tggccgacga ggcctccatg gacagcgggg cacgctggca gcgcgggagg 1020
ctggcgctgc gccgggcccc gggccccgat ggccccgacc gcgtgctgga gctcttcgac 1080
ccacccaaga gttcaaggcc caagctacaa gcagcttgct ccagcatcca ggaggtccgg 1140
tggtgcacac ggcttgagat gcctgacaac ctttacacct ttgtgctgaa ggtgaaggac 1200
cggacagaca tcatctttga ggtgggagac gagcagcagc tgaattcatg gatggctgag 1260
ctctcggagt gcacaggccg agggctggag agcacagaag cagagatgca tattccctca 1320
gccctagagc ctagcacgtc cagctcccca aggggcagca cagattccct taaccaaggt 1380
gcttctcctg gggggctgct ggacccggcc tgccagaaga cggaccattt cctgtcctgc 1440
tacccctggt tccacggccc catctccaga gtgaaagcag ctcagctggt tcagctgcag 1500
ggccctgatg ctcatggagt gttcctggtg cggcagagcg agacgcggcg tggggaatac 1560
gtgctcactt tcaactttca ggggatagcc aagcacctgc gcctgtcgct gacagagcgg 1620
ggccagtgcc gtgtgcagca cctccacttt ccctcggtcg tggacatgct ccaccacttc 1680
cagcgctcgc ccatcccact cgagtgcggc gccgcctgtg atgtccggct ctccagctac 1740
gtggtagtcg tctcccaacc accaggttcc tgcaacacgg tcctcttccc tttctccctt 1800
cctcactggg attcagagtc ccttcctcac tggggttcag agttgggcct tccccacctt 1860
agttcttctg gctgtccccg ggggctcagc ccagagggtc tcccagggcg atcctcaccc 1920
cccgagcaga tcttccacct ggtgccttcg cccgaagaac tggccaacag cctgcagcac 1980
ctggagcatg agcctgtgaa tcgagcccgg gactcggact acgaaatgga ctcatcctcc 2040
cggagccacc tgcgggccat agacaatcag tacacacctc tctgaccagt gaggaattcc 2100
aggcctcaac agctgccctt gaggagcaca ggcagaagtg tgaacttgtg aatgtaattg 2160
atctttcctt ccttccagag aaagatttaa gggacactgt taactgctcg tgccagtttg 2220
gaagtgaccc ttctattagg cctgttgaag ggccctcctg taggtttcat ctatccacct 2280
ggctttctcc ttattgttta cagatgtagt tcttgttaga ggatgccgct agctcctgcc 2340
cggggtccct atgcccagtc cccgttactc ttagagaaag gagttggggt gagggccaga 2400
gctggcagtg gaaacttgtt ctctttttca ctgacactgt cacagcggat gacagacttt 2460
ctacggggag gaggggggga tcatcaggaa gcccagaaca ctaacaagcg gttctcccat 2520
ctaccgtcag tccacatggc aggtctgctg tgtccacacc acagatgacc acatctaatc 2580
ctgcttctac tctcagcttt aggacaaaag ctctgtcaga ggcacaagct gaaggtcaaa 2640
aatgatttaa aacattttac ctcagactaa tttctttaaa ggattcaggt tcaaaactta 2700
accactgctt atttcagtgc actgtttcaa ctaacaccca tgctattttt gtagtcagaa 2760
acagctatgc aaaccctacc taatttacag tctgagccag catgctggct tgtctactgc 2820
atcctcggga cagtcacctg ccactgagtg gccactgtcc ttcctaaatg tcaagaagtg 2880
aagtatgtca ccctttcagg gaaattcagg caattactga aataggaggg tggcaagaac 2940
agttctatcc tggtgcctta cgaataaaaa actggattct ggtttacagc agctttacag 3000
tgatagttaa attaactggg gctaggggaa gagcaagcaa aaagggaaga aggactccta 3060
ggccctttct agtaaatcct tcagcaacaa ggctggcttg gtgccctcca agcatctaat 3120
ggcttattaa attatcccac aagtgggttt taggctcctt ttttgagcca aaatggaagc 3180
tgggaatctg gtgccataac taatgagaaa ctcctttaat agcccacaat cagtgttctg 3240
ttctagctgg ctactgcttc actggattga gaatctatct atctccttgc acacatgggc 3300
acacacaatc tccaccatcc agggaggtcc tgaagtcaaa tctctatcta tacaagtgat 3360
acaattcata gggggctggc tcctcccaga acctgtctgg aggctcagaa acgggggcag 3420
tgacagtgga gtcagctgct cttgggtgcc agcagagcca ttcagtacaa cccccaggct 3480
cacagcagtg gcttctagga aactgggagt ttagatcagc tttacagata catcgatcag 3540
aggctaaaat gaaacctcag cctaaaactc ataggactga ctgcctggga ggagggttag 3600
gtctgcttct tccacttata cttagtctct gtgctccaag aggtcaaatt tttgcttcta 3660
gaatttcctt ggggtctttc agagggtggg ggaacaaacc cctatgcact tttctttttt 3720
ttttttttga gatggagttt ctcttgtcaa ccgggctgga gtgcagtggt gcaatcttgg 3780
ctcactgcaa cctccacctt cctggttcaa gcgattctgc ctcgacctct caagtagctg 3840
ggattacaag caccagccac catgcctggc taattttgta tttttagtag agacagggtt 3900
tcaccatgtt ggccaggctg gtctcgaatg tctgacctca ggtgatccac ccgccttggc 3960
ctcccaaagt gctgggatta caggcgcgag ccaccgcgcc cagcctacac cacttttagt 4020
accaacactc ttgggtgatt tcatggaccc taaagcagac ctgacactga tccagatttg 4080
cagtccattt ttaaggacac ctgtctttat ttcctcaaag tcaagcagct ttctctggaa 4140
aatgaatgct aattagtgtg aaccaaaaga gtaagtaaga gtctgaagtt tttttaaagg 4200
agaaagctta ttatggaaag tcactggtcc tcccctccgc acaggaaagg tacccagtag 4260
ataatgaacc aaattaagtt ccctccctcc agccagaagt taaacatctg ggatatgacg 4320
tcttcatgcc aggggcactc atttcttagc agcctctcta catacatctc tcaggtggtg 4380
ccaagaggca caccaggtag agcaaactta gcagctctga ctaacaggct gcaaagtgca 4440
agttcagatt ctgtggcaga gatttggaag gcacccacct ccagactgct tcccgtccaa 4500
gttaccagga cagctcaaaa acatgctgac agaaaactcc catggctcta ggaagaagtg 4560
acactaagcc aacacctttc tttatgtggg agcagaatca gctgatgaag gggtgggcag 4620
cagtgtgggg caggcacccc actggctgca gctagcccac cataggcaca gcacatccca 4680
ccactctcct tccagtcctg accaggcccc agccggcaac ttctaccgag agccatggct 4740
caacaccaaa ctggacagta gacatcatga tccctccagt tagctctaat tacagacccc 4800
accagtacag cttgacagct cccggcacca tcccttcctt catctgactt attgaacttt 4860
tacaaactaa cagtcaccag caccaaagaa ttaagtcaac taacctgcct tgaattttag 4920
accagcaatc catatggctt tatctggtat aaatcttctg cctttgatca tttctggacc 4980
gtaggaaaaa ggaatagcaa tcattaaaat cttgggccag agaacactat ttttacataa 5040
cagtttctta acctaaagtc aaggccttgg actcttccct gagggttgcc tgagattcct 5100
tcatgctttc tattcaggac taagtccctt actgcaaatg tgttagctct aacatctccc 5160
acaagctaga ggaacttgcg agtatattaa caaggacaca tctgacatcc tgtgtttggt 5220
tagaatatac agcacattgt gataacataa agtggattca tcttgtatca ttataggcag 5280
aaggtatttg gcaaattttt atgtattgtt ttatgtactg tacaagtaac ttattcttga 5340
ataatgcaaa ttttgctata atgtacaaat tgctatatgt gaattaaaaa gttttcagaa 5400
tcttgaaaaa aaaaaaaaaa aaaaa 5425
<210> 65
<211> 1697
<212> DNA
<213> 智人
<400> 65
atttccagtg ctagaggccc acagtttcag tctcatctgc ctccactcgg cctcagttcc 60
tcatcactgt tcctgtgctc acagtcatca attatagacc ccacaacatg cgccctgaag 120
acagaatgtt ccatatcaga gctgtgatct tgagagccct ctccttggct ttcctgctga 180
gtctccgagg agctggggcc atcaaggcgg accatgtgtc aacttatgcc gcgtttgtac 240
agacgcatag accaacaggg gagtttatgt ttgaatttga tgaagatgag atgttctatg 300
tggatctgga caagaaggag accgtctggc atctggagga gtttggccaa gccttttcct 360
ttgaggctca gggcgggctg gctaacattg ctatattgaa caacaacttg aataccttga 420
tccagcgttc caaccacact caggccacca acgatccccc tgaggtgacc gtgtttccca 480
aggagcctgt ggagctgggc cagcccaaca ccctcatctg ccacattgac aagttcttcc 540
caccagtgct caacgtcacg tggctgtgca acggggagct ggtcactgag ggtgtcgctg 600
agagcctctt cctgcccaga acagattaca gcttccacaa gttccattac ctgacctttg 660
tgccctcagc agaggacttc tatgactgca gggtggagca ctggggcttg gaccagccgc 720
tcctcaagca ctgggaggcc caagagccaa tccagatgcc tgagacaacg gagactgtgc 780
tctgtgccct gggcctggtg ctgggcctag tcggcatcat cgtgggcacc gtcctcatca 840
taaagtctct gcgttctggc catgaccccc gggcccaggg gaccctgtga aatactgtaa 900
aggtgacaaa atatctgaac agaagaggac ttaggagaga tctgaactcc agctgcccta 960
caaactccat ctcagctttt cttctcactt catgtgaaaa ctactccagt ggctgactga 1020
attgctgacc cttcaagctc tgtccttatc cattacctca aagcagtcat tccttagtaa 1080
agtttccaac aaatagaaat taatgacact ttggtagcac taatatggag attatccttt 1140
cattgagcct tttatcctct gttctccttt gaagaacccc tcactgtcac cttcccgaga 1200
ataccctaag accaataaat acttcagtat ttcagagcgg ggagactctg agtcattctt 1260
actggaagtc taggaccagg tcacatgtga atactatttc ttgaaggtgt ggtttcaacc 1320
tctgttgccg atgtggttac taaaggttct gatcccactt gaacggaaag gtctgaggat 1380
attgattcag tcctgggttt ttccctaact acaggatagg gtggggtaga gaaaggatat 1440
ttgggggaaa ttttacttgg atgaagattt tcttggatgt agtttgaaga ctgcagtgtt 1500
tgaagtctct gagggaagag atttggtctg tctggatcaa gatttcaggc agattaggat 1560
tccattcaca gcccctgagc ttccttccca aggctgtatt gtaattatag caatatttca 1620
tggaggattt ttctacatga taaactaaga gccaagaaat aaaattttta aaatgcccta 1680
aaaaaaaaaa aaaaaaa 1697
<210> 66
<211> 1401
<212> DNA
<213> 智人
<400> 66
ggaggaggag cctctgccag actggagaga agcaggcctg agcctcccca aaggcagctc 60
ctggggactc ccaggaccac aggctgagac gagacgcagg gtggctggag gaagtgagag 120
gtgaactcag cctgggactg gctgggcgag actctccacc tgctccctgg gaccatcgcc 180
caccatggct gtggcccagc agctgcgggc cgagagtgac tttgaacagc ttccggatga 240
tgttgccatc tcggccaaca ttgctgacat cgaggagaag agaggcttca ccagccactt 300
tgttttcgtc atcgaggtga agacaaaagg aggatccaag tacctcatct accgccgcta 360
ccgccagttc catgctttgc agagcaagct ggaggagcgc ttcgggccag acagcaagag 420
cagtgccctg gcctgtaccc tgcccacact cccagccaaa gtctacgtgg gtgtgaaaca 480
ggagatcgcc gagatgcgga tacctgccct caacgcctac atgaagagcc tgctcagcct 540
gccggtctgg gtgctgatgg atgaggacgt ccggatcttc ttttaccagt cgccctatga 600
ctcagagcag gtgccccagg cactccgccg gctccgcccg cgcacccgga aagtcaagag 660
cgtgtcccca cagggcaaca gcgttgaccg catggcagct ccgagagcag aggctctatt 720
tgacttcact ggaaacagca aactggagct gaatttcaaa gctggagatg tgatcttcct 780
cctcagtcgg atcaacaaag actggctgga gggcactgtc cggggagcca cgggcatctt 840
ccctctctcc ttcgtgaaga tcctcaaaga cttccctgag gaggacgacc ccaccaactg 900
gctgcgttgc tactactacg aagacaccat cagcaccatc aaggacatcg cggtggagga 960
agatctcagc agcactcccc tattgaaaga cctgctggag ctcacaaggc gggagttcca 1020
gagagaggac atagctctga attaccggga cgctgagggg gatctggttc ggctgctgtc 1080
ggatgaggac gtagcgctca tggtgcggca ggctcgtggc ctcccctccc agaagcgcct 1140
cttcccctgg aagctgcaca tcacgcagaa ggacaactac agggtctaca acacgatgcc 1200
atgagctgac ggtgtccctg gagcagtgag gggacaccag caaaaacctt cagctctcag 1260
aggagattgg gaccaggaaa acctgggagg atgggcagac ttcctgtctt tgaggctaat 1320
ggacccgtgg ggcttgtaat ctgtctcttt ctactattta catctgattt aaataaacca 1380
ttccatctga aaggggcaaa a 1401
<210> 67
<211> 3372
<212> DNA
<213> 智人
<400> 67
taaaaccagg aagtgaagtc cccgagcacg ttagaaagcc tgacatggcc tgactcggga 60
cagctcagag cagggcagaa ctggggacac tctgggccgg ccttctgcct gcatggacgc 120
tctgaagcca ccctgtctct ggaggaacca cgagcgaggg aagaaggaca gggactcgtg 180
tggcaggaag aactcagagc cgggaagccc ccattcacta gaagcactga gagatgcggc 240
cccctcgcag ggtctgaatt tcctgctgct gttcacaaag atgcttttta tctttaactt 300
tttgttttcc ccacttccga ccccggcgtt gatctgcatc ctgacatttg gagctgccat 360
cttcttgtgg ctgatcacca gacctcaacc cgtcttacct cttcttgacc tgaacaatca 420
gtctgtggga attgagggag gagcacggaa gggggtttcc cagaagaaca atgacctaac 480
aagttgctgc ttctcagatg ccaagactat gtatgaggtt ttccaaagag gactcgctgt 540
gtctgacaat gggccctgct tgggatatag aaaaccaaac cagccctaca gatggctatc 600
ttacaaacag gtgtctgata gagcagagta cctgggttcc tgtctcttgc ataaaggtta 660
taaatcatca ccagaccagt ttgtcggcat ctttgctcag aataggccag agtggatcat 720
ctccgaattg gcttgttaca cgtactctat ggtagctgta cctctgtatg acaccttggg 780
accagaagcc atcgtacata ttgtcaacaa ggctgatatc gccatggtga tctgtgacac 840
accccaaaag gcattggtgc tgatagggaa tgtagagaaa ggcttcaccc cgagcctgaa 900
ggtgatcatc cttatggacc cctttgatga tgacctgaag caaagagggg agaagagtgg 960
aattgagatc ttatccctat atgatgctga gaacctaggc aaagagcact tcagaaaacc 1020
tgtgcctcct agcccagaag acctgagcgt catctgcttc accagtggga ccacaggtga 1080
ccccaaagga gccatgataa cccatcaaaa tattgtttca aatgctgctg cctttctcaa 1140
atgtgtggag catgcttatg agcccactcc tgatgatgtg gccatatcct acctccctct 1200
ggctcatatg tttgagagga ttgtacaggc tgttgtgtac agctgtggag ccagagttgg 1260
attcttccaa ggggatattc ggttgctggc tgacgacatg aagactttga agcccacatt 1320
gtttcccgcg gtgcctcgac tccttaacag gatctacgat aaggtacaaa atgaggccaa 1380
gacacccttg aagaagttct tgttgaagct ggctgtttcc agtaaattca aagagcttca 1440
aaagggtatc atcaggcatg atagtttctg ggacaagctc atctttgcaa agatccagga 1500
cagcctgggc ggaagggttc gtgtaattgt cactggagct gcccccatgt ccacttcagt 1560
catgacattc ttccgggcag caatgggatg tcaggtgtat gaagcttatg gtcaaacaga 1620
atgcacaggt ggctgtacat ttacattacc tggggactgg acatcaggtc acgttggggt 1680
gcccctggct tgcaattacg tgaagctgga agatgtggct gacatgaact actttacagt 1740
gaataatgaa ggagaggtct gcatcaaggg tacaaacgtg ttcaaaggat acctgaagga 1800
ccctgagaag acacaggaag ccctggacag tgatggctgg cttcacacag gagacattgg 1860
tcgctggctc ccgaatggaa ctctgaagat catcgaccgt aaaaagaaca ttttcaagct 1920
ggcccaagga gaatacattg caccagagaa gatagaaaat atctacaaca ggagtcaacc 1980
agtgttacaa atttttgtac acggggagag cttacggtca tccttagtag gagtggtggt 2040
tcctgacaca gatgtacttc cctcatttgc agccaagctt ggggtgaagg gctcctttga 2100
ggaactgtgc caaaaccaag ttgtaaggga agccatttta gaagacttgc agaaaattgg 2160
gaaagaaagt ggccttaaaa cttttgaaca ggtcaaagcc atttttcttc atccagagcc 2220
attttccatt gaaaatgggc tcttgacacc aacattgaaa gcaaagcgag gagagctttc 2280
caaatacttt cggacccaaa ttgacagcct gtatgagcac atccaggatt aggataaggt 2340
acttaagtac ctgccggccc actgtgcact gcttgtgaga aaatggatta aaaactattc 2400
ttacatttgt tttgcctttc ctcctatttt tttttaacct gttaaactct aaagccatag 2460
cttttgtttt atattgagac atataatgtg taaacttagt tcccaaataa atcaatcctg 2520
tctttcccat cttcgatgtt gctaatatta aggcttcagg gctactttta tcaacatgcc 2580
tgtcttcaag atcccagttt atgttctgtg tccttcctca tgatttccaa ccttaatact 2640
attagtaacc acaagttcaa gggtcaaagg gaccctctgt gccttcttct ttgttttgtg 2700
ataaacataa cttgccaaca gtctctatgc ttatttacat cttctactgt tcaaactaag 2760
agatttttaa attctgaaaa actgcttaca attcatgttt tctagccact ccacaaacca 2820
ctaaaatttt agttttagcc tatcactcat gtcaatcata tctatgagac aaatgtctcc 2880
gatgctcttc tgcgtaaatt aaattgtgta ctgaagggaa aagtttgatc ataccaaaca 2940
tttcctaaac tctctagtta gatatctgac ttgggagtat taaaaattgg gtctatgaca 3000
tattgtccaa aaggaatgct gttcttaaag cattatttac agtaggaact ggggagtaaa 3060
tctgttccct acagtttgct gctgagctgg aagctgtggg ggaaggagtt gacaggtggg 3120
cccagtgaac ttttccagta aatgaagcaa gcactgaata aaaacctcct gaactgggaa 3180
caaagatcta caggcaagca agatgcccac acaacaggct tattttctgt gaaggaacca 3240
actgatctcc cccacccttg gattagagtt cctgctctac cttacccaca gataacacat 3300
gttgtttcta cttgtaaatg taaagtcttt aaaataaact attacagata cttaaaaaaa 3360
aaaaaaaaaa aa 3372
<210> 68
<211> 1855
<212> DNA
<213> 智人
<400> 68
ctctgaaggg agctactcag aagcgggagt ctccgagaga agaaaagcag gtggaaggag 60
aggaagcgga tgccgtgggg tttacagcag gaaaatccgt ggagacagca gatccgagaa 120
gcggcgatgt ttgcgtagaa ccctgtacgt gcttccttcg gcctgtcgct cttcccttct 180
ctctgaccag caccatgctt ctcctggtga caagccttct gctctgtgag ttaccacacc 240
cagcattcct cctgatccca gagaaatcgg atctgcgaac agtggcacca gcctctagtc 300
tcaatgtgag gtttgactcc aggacgatga atttaagctg ggactgccaa gaaaacacaa 360
ccttcagcaa gtgtttctta actgacaaga agaacagagt cgtggaaccc aggctcagta 420
acaacgaatg ttcgtgcaca tttcgtgaaa tttgtctgca tgaaggagtc acatttgagg 480
ttcacgtgaa tactagtcaa agaggatttc aacagaaact gctttatcca aattcaggaa 540
gggagggtac cgctgctcag aatttctcct gtttcatcta caatgcggat ttaatgaact 600
gtacctgggc gaggggtccg acggcccccc gtgacgtcca gtattttttg tacatacgaa 660
actcaaagag aaggagggag atccggtgtc cttattacat acaagactca ggaacccatg 720
tgggatgtca cctggataac ctgtcaggat taacgtctcg caattacttt ctggttaacg 780
gaaccagccg agaaattggc atccaattct ttgattcact tttggacaca aagaaaatag 840
aacgattcaa ccctcccagc aatgtcaccg tacgttgcaa cacgacgcac tgcctcgtac 900
ggtggaaaca gcccaggacc tatcagaagc tgtcgtacct ggactttcag taccagctgg 960
acgtccacag aaagaatacc cagcctggca cggaaaacct actgattaat gtttctggtg 1020
atttggaaaa tagatacaac tttccaagct ctgagcccag agcaaaacac agtgtgaaga 1080
tcagagctgc agacgtccgc atcttgaatt ggagctcctg gagtgaagcc attgaatttg 1140
gttctgacga cgggaacctc ggctctgtgt acatttatgt gctcctaatc gtgggaaccc 1200
ttgtctgtgg catcgtcctc ggcttcctct ttaaaaggtt ccttaggata cagcggctgt 1260
tcccgccagt tccacagatc aaagacaaac tgaatgataa ccatgaggtg gaagacgaga 1320
tcatctggga ggaattcacc ccagaggaag ggaaaggcta ccgcgaagag gtcttgaccg 1380
tgaaggaaat tacctgagac ccagagggtg taggaatggc atggacatct ccgcctccgc 1440
gacacggggg aactgttttc ttgatgatgc tgtgaacctt tatatcattt tctatgtttt 1500
tatttaaaaa catgacattt ggggccaggc gcggtggctc acgcctgtaa tcccagcact 1560
ttgggaggcc aaggcaggcg gatcacctga ggtcaggagt tcaagaccag cctgcccaac 1620
atggtgaaac cccatctgga ctaaaaatgc agaaatttac ccaggcacgg cggcggacgc 1680
ccatcatccc agctacttgg gaggctgagg caggagaatt gcttgaaccc gtgaggcgga 1740
ggttgtagtg agccaagatc gcaccattgc acaccaacct gcgtgacaga gcaagattgc 1800
atctcaaaac aaacaataat aataaataat aaaaacctga tatttggctg ggcaa 1855
<210> 69
<211> 2240
<212> DNA
<213> 智人
<400> 69
ggagggcagc cagcagcttc cccttctctg ccctgctcca ggcaccaggc tctttcccct 60
tcagtgtctc agaggagggg acggcagcac catggacccc cgcttgtcca ctgtccgcca 120
gacctgctgc tgcttcaatg tccgcatcgc aaccaccgcc ctggccatct accatgtgat 180
catgagcgtc ttgttgttca tcgagcactc agtagaggtg gcccatggca aggcgtcctg 240
caagctctcc cagatgggct acctcaggat cgctgacctg atctccagct tcctgctcat 300
caccatgctc ttcatcatca gcctgagcct actgatcggc gtagtcaaga accgggagaa 360
gtacctgctg cccttcctgt ccctgcaaat catggactat ctcctgtgcc tgctcaccct 420
gctgggctcc tacattgagc tgcccgccta cctcaagttg gcctcccgga gccgtgctag 480
ctcctccaag ttccccctga tgacgctgca gctgctggac ttctgcctga gcatcctgac 540
cctctgcagc tcctacatgg aagtgcccac ctatctcaac ttcaagtcca tgaaccacat 600
gaattacctc cccagccagg aggatatgcc tcataaccag ttcatcaaga tgatgatcat 660
cttttccatc gccttcatca ctgtccttat cttcaaggtc tacatgttca agtgcgtgtg 720
gcggtgctac agattgatca agtgcatgaa ctcggtggag gagaagagaa actccaagat 780
gctccagaag gtggtcctgc cgtcctacga ggaagccctg tctttgccat cgaagacccc 840
agaggggggc ccagcaccac ccccatactc agaggtgtga ccctcgccag gccccagccc 900
cagtgctggg aggggtggag ctgcctcata atctgctttt ttgctttggt ggcccctgtg 960
gcctgggtgg gccctcccgc ccctccctgg caggacaatc tgcttgtgtc tccctcgctg 1020
gcctgctcct cctgcagggc ctgtgagctg ctcacaactg ggtcaacgct ttaggctgag 1080
tcactcctcg ggtctctcca taattcagcc caacaatgct tggtttattt caatcagctc 1140
tgacacttgt ttagacgatt ggccattcta aagttggtga gtttgtcaag caactatcga 1200
cttgatcagt tcagccaagc aactgacaaa tcaaaaaccc acttgtcagt tcagtaaaat 1260
aatttggtca aacaacagtc tattgcattg atttataaat agttgtcagt tcacatagca 1320
atttaatcaa gtaatcatta attagttacc ccctatatat aaatatatgt aatcaatttc 1380
ttcaaatagc ttgcttacat gataatcaat tagccaacca tgagtcattt agaatagtga 1440
taaatagaat acacagaata gtgatgaaat tcaatttaaa aaatcacgtt agcctccaaa 1500
ccatttaatt caaatgaacc catcaactgg atgccaactc tggcgaatgt aggacctctg 1560
agtggctgta taattgttaa ttcaaatgaa attcatttaa acagttgaca aactgtcatt 1620
caacaattag ctccaggaaa taacagttat ttcatcataa aacagtccct tcaaacacac 1680
aattgttctg ctgaagagtt gtcatcaaca atccaatgct cacctattca gttgctctgt 1740
ggtcagtgtg gctgcataac agtggattcc atgaaaggag tcattttagt gatgagctgc 1800
cagtccattc ccaggccagg ctgtcgctgg ccatccattc agtcgattca gtcataggcg 1860
aatctgttct gcccgaggct tgtggtcaag caaaaattca gccctgaaat caggcacatc 1920
tgttcgttgg actaaaccca caggttagtt cagtcaaagc aggcaacccc cttgtgggca 1980
ctgaccctgc cactggggtc atggcggttg tggcagctgg ggaggtttgg ccccaacagc 2040
cctcctgtgc ctgcttccct gtgtgtcggg gtcctccagg gagctgaccc agaggtggag 2100
gccacggagg cagggtctct ggggactgtc ggggggtaca gagggagaag gctctgcaag 2160
agctccctgg caataccccc ttgtgtaatt gctttgtgtg cgacagggag gaagtttcaa 2220
taaagcagca acaagcttct 2240
<210> 70
<211> 2135
<212> DNA
<213> 智人
<400> 70
aaagccgacc gagacggagc cgctgtcaac tctccaactc agctcagctg atcggttgcc 60
gccgccgccg ccgccagatt ctggaggcga agaacgcaaa gctgagaaca tggacgttaa 120
tatcgcccca ctccgcgcct gggacgattt cttcccgggt tccgatcgct ttgcccggcc 180
ggacttcagg gacatttcca aatggaacaa ccgcgtagtg agcaacctgc tctattacca 240
gaccaactac ctggtggtgg ctgccatgat gatttccatt gtggggtttc tgagtccctt 300
caacatgatc ctgggaggaa tcgtggtggt gctggtgttc acagggtttg tgtgggcagc 360
ccacaataaa gacgtccttc gccggatgaa gaagcgctac cccacgacgt tcgttatggt 420
ggtcatgttg gcgagctatt tccttatctc catgtttgga ggagtcatgg tctttgtgtt 480
tggcattact tttcctttgc tgttgatgtt tatccatgca tcgttgagac ttcggaacct 540
caagaacaaa ctggagaata aaatggaagg aataggtttg aagaggacac cgatgggcat 600
tgtcctggat gccctagaac agcaggaaga aggcatcaac agactcactg actatatcag 660
caaagtgaag gaataaacat aacttacctg agctagggtt gcagcagaaa ttgagttgca 720
gcttgccctt gtccagacct atgttctgct tgcgtttttg aaacaggagg tgcacgtacc 780
acccaattat ctatggcagc atgcatgtat aggccgaact attatcagct ctgatgtttc 840
agagagaaga cctcagaaac cgaaagaaaa ccaccaccct cctattgtgt ctgaagtttc 900
acgtgtgttt atgaaatcta atgggaaatg gatcacacga tttctttaag ggaattaaaa 960
aaaataaaag aattacggct tttacagcaa caatacgatt atcttatagg aaaaaaaaaa 1020
tcattgtaaa gtatcaagac aatacgagta aatgaaaagg ctgttaaagt agatgacatc 1080
atgtgttagc ctgttcctaa tcccctagaa ttgtaatgtg tgggatataa attagttttt 1140
attattctct taaaaatcaa agatgatctc tatcactttg ccacctgttt gatgtgcagt 1200
ggaaactggt taagccagtt gttcatactt cctttacaaa tataaagata gctgtttagg 1260
atattttgtt acatttttgt aaatttttga aatgctagta atgtgttttc accagcaagt 1320
atttgttgca aacttaatgt cattttcctt aagatggtta cagctatgta acctgtatta 1380
ttctggacgg acttattaaa atacaaacag acaaaaaata aaacaaaact tgagttctat 1440
ttaccttgca cattttttgt tgttacagtg aaaaaaatgg tccaagaaaa tgtttgccat 1500
ttttgcattg tttcgttttt aactggaaca tttagaaaga aggaaatgaa tgtgcatttt 1560
attaattcct taggggcaca aggaggacaa taatagctga tcttttgaaa tttgaaaaac 1620
gtctttagat gaccaagcaa aaagacttta aaaaatggta atgaaaatgg aatgcagcta 1680
ctgcagctaa taaaaaattt tagatagcaa ttgttacaac catatgcctt tatagctaga 1740
cattagaatt atgatagcat gagtttatac attctattat ttttcctccc tttctcatgt 1800
ttttataaat aggtaataaa aaatgttttg cctgccaatt gaatgatttc gtagctgaag 1860
tagaaacatt taggtttctg tagcattaaa ttgtgaagac aactggagtg gtacttactg 1920
aagaaactct ctgtatgtcc tagaataaga agcaatgatg tgctgcttct gatttttctt 1980
gcattttaaa ttctcagcca acctacagcc atgatcttta gcacagtgat atcaccatga 2040
cttcacagac atggtctaga atctgtaccc ttacccacat atgaagaata aaattgatta 2100
aaggtttttt tggtgagact ttatttaaaa aaaaa 2135
<210> 71
<211> 2120
<212> DNA
<213> 智人
<400> 71
aattaaacac ttggagatat tccttgagga atgaaatgct tggtgagcag gcatacagtg 60
agggaaacac tggatatggt gtttcagaga atgtcagtgg aagcaggggt tattaaatgc 120
aaagcagctg tgctttggga gcagaagcaa cccttctcca ttgaggaaat agaagttgcc 180
ccaccaaaga ctaaagaagt tcgcattaag attttggcca caggaatctg tcgcacagat 240
gaccatgtga taaaaggaac aatggtgtcc aagtttccag tgattgtggg acatgaggca 300
actgggattg tagagagcat tggagaagga gtgactacag tgaaaccagg tgacaaagtc 360
atccctctct ttctgccaca atgtagagaa tgcaatgctt gtcgcaaccc agatggcaac 420
ctttgcatta ggagcgatat tactggtcgt ggagtactgg ctgatggcac caccagattt 480
acatgcaagg gcaaaccagt ccaccacttc atgaacacca gtacatttac cgagtacaca 540
gtggtggatg aatcttctgt tgctaagatt gatgatgcag ctcctcctga gaaagtctgt 600
ttaattggct gtgggttttc cactggatat ggcgctgctg ttaaaactgg caaggtcaaa 660
cctggttcca cttgcgtcgt ctttggcctg ggaggagttg gcctgtcagt catcatgggc 720
tgtaagtcag ctggtgcatc taggatcatt gggattgacc tcaacaaaga caaatttgag 780
aaggccatgg ctgtaggtgc cactgagtgt atcagtccca aggactctac caaacccatc 840
agtgaggtgc tgtcagaaat gacaggcaac aacgtgggat acacctttga agttattggg 900
catcttgaaa ccatgattga tgccctggca tcctgccaca tgaactatgg gaccagcgtg 960
gttgtaggag ttcctccatc agccaagatg ctcacctatg acccgatgtt gctcttcact 1020
ggacgcacat ggaagggatg tgtctttgga ggtttgaaaa gcagagatga tgtcccaaaa 1080
ctagtgactg agttcctggc aaagaaattt gacctggacc agttgataac tcatgtttta 1140
ccatttaaaa aaatcagtga aggatttgag ctgctcaatt caggacaaag cattcgaacg 1200
gtcctgacgt tttgagatcc aaagtggcag gaggtctgtg ttgtcatggt gaactggagt 1260
ttctcttgtg agagttccct catctgaaat catgtatctg tctcacaaat acaagcataa 1320
gtagaagatt tgttgaagac atagaaccct tataaagaat tattaacctt tataaacatt 1380
taaagtcttg tgagcacctg ggaattagta taataacaat gttaatattt ttgatttaca 1440
ttttgtaagg ctataattgt atcttttaag aaaacataca cttggatttc tatgttgaaa 1500
tggagatttt taagagtttt aaccagctgc tgcagatata taactcaaaa cagatatagc 1560
gtataaagat atagtaaatg catctcctag agtaatattc acttaacaca ttgaaactat 1620
tattttttag atttgaatat aaatgtattt tttaaacact tgttatgagt taagttggat 1680
tacattttga aatcagttca ttccatgatg catattactg gattagatta agaaagacag 1740
aaaagattaa gggacgggca catttttcaa cgattaagaa tcatcattac ataacttggt 1800
gaaactgaaa aagtatatca tatgggtaca caaggctatt tgccagcata tattaatatt 1860
ttagaaaata ttccttttgt aatactgaat ataaacatag agctagaatc atattatcat 1920
acttatcata atgttcaatt tgatacagta gaattgcaag tccctaagtc cctattcact 1980
gtgcttagta gtgactccat ttaataaaaa gtgtttttag tttttaacaa ctacactgat 2040
gtatctatat atatctataa catgttaaaa attcttaaga aaattaaaaa ttatataaaa 2100
tgaaaaaaaa aaaaaaaaaa 2120
<210> 72
<211> 5872
<212> DNA
<213> 智人
<400> 72
gggaatgctt tgtgcagcgc gcttgcgcgg tgtggcggcc gatgccgcta taaaggcttg 60
ttttgctgca gggctcatgc tcgggagcgt ggttgagcgg ctggcgcggt tgtcctggag 120
caggggcgca ggaattctga tgtgaaacta acagtctgtg agccctggaa cctccactca 180
gagaagatga aggatatcga cataggaaaa gagtatatca tccccagtcc tgggtataga 240
agtgtgaggg agagaaccag cacttctggg acgcacagag accgtgaaga ttccaagttc 300
aggagaactc gaccgttgga atgccaagat gccttggaaa cagcagcccg agccgagggc 360
ctctctcttg atgcctccat gcattctcag ctcagaatcc tggatgagga gcatcccaag 420
ggaaagtacc atcatggctt gagtgctctg aagcccatcc ggactacttc caaacaccag 480
cacccagtgg acaatgctgg gcttttttcc tgtatgactt tttcgtggct ttcttctctg 540
gcccgtgtgg cccacaagaa gggggagctc tcaatggaag acgtgtggtc tctgtccaag 600
cacgagtctt ctgacgtgaa ctgcagaaga ctagagagac tgtggcaaga agagctgaat 660
gaagttgggc cagacgctgc ttccctgcga agggttgtgt ggatcttctg ccgcaccagg 720
ctcatcctgt ccatcgtgtg cctgatgatc acgcagctgg ctggcttcag tggaccagcc 780
ttcatggtga aacacctctt ggagtatacc caggcaacag agtctaacct gcagtacagc 840
ttgttgttag tgctgggcct cctcctgacg gaaatcgtgc ggtcttggtc gcttgcactg 900
acttgggcat tgaattaccg aaccggtgtc cgcttgcggg gggccatcct aaccatggca 960
tttaagaaga tccttaagtt aaagaacatt aaagagaaat ccctgggtga gctcatcaac 1020
atttgctcca acgatgggca gagaatgttt gaggcagcag ccgttggcag cctgctggct 1080
ggaggacccg ttgttgccat cttaggcatg atttataatg taattattct gggaccaaca 1140
ggcttcctgg gatcagctgt ttttatcctc ttttacccag caatgatgtt tgcatcacgg 1200
ctcacagcat atttcaggag aaaatgcgtg gccgccacgg atgaacgtgt ccagaagatg 1260
aatgaagttc ttacttacat taaatttatc aaaatgtatg cctgggtcaa agcattttct 1320
cagagtgttc aaaaaatccg cgaggaggag cgtcggatat tggaaaaagc tgggtacttc 1380
cagagcatca ctgtgggtgt ggctcccatt gtggtggtga ttgccagcgt ggtgaccttc 1440
tctgttcata tgaccctggg cttcgatctg acagcagcac aggctttcac agtggtgaca 1500
gtcttcaatt ccatgacttt tgctttgaaa gtaacaccgt tttcagtaaa gtccctctca 1560
gaagcctcag tggctgttga cagatttaag agtttgtttc taatggaaga ggttcacatg 1620
ataaagaaca aaccagccag tcctcacatc aagatagaga tgaaaaatgc caccttggca 1680
tgggactcct cccactccag tatccagaac tcgcccaagc tgacccccaa aatgaaaaaa 1740
gacaagaggg cttccagggg caagaaagag aaggtgaggc agctgcagcg cactgagcat 1800
caggcggtgc tggcagagca gaaaggccac ctcctcctgg acagtgacga gcggcccagt 1860
cccgaagagg aagaaggcaa gcacatccac ctgggccacc tgcgcttaca gaggacactg 1920
cacagcatcg atctggagat ccaagagggt aaactggttg gaatctgtgg cagtgtggga 1980
agtggaaaaa cctctctcat ttcagccatt ttaggccaga tgacgcttct agagggcagc 2040
attgcaatca gtggaacctt cgcttatgtg gcccagcagg cctggatcct caatgctact 2100
ctgagagaca acatcctgtt tgggaaggaa tatgatgaag aaagatacaa ctctgtgctg 2160
aacagctgct gcctgaggcc tgacctggcc attcttccca gcagcgacct gacggagatt 2220
ggagagcgag gagccaacct gagcggtggg cagcgccaga ggatcagcct tgcccgggcc 2280
ttgtatagtg acaggagcat ctacatcctg gacgaccccc tcagtgcctt agatgcccat 2340
gtgggcaacc acatcttcaa tagtgctatc cggaaacatc tcaagtccaa gacagttctg 2400
tttgttaccc accagttaca gtacctggtt gactgtgatg aagtgatctt catgaaagag 2460
ggctgtatta cggaaagagg cacccatgag gaactgatga atttaaatgg tgactatgct 2520
accattttta ataacctgtt gctgggagag acaccgccag ttgagatcaa ttcaaaaaag 2580
gaaaccagtg gttcacagaa gaagtcacaa gacaagggtc ctaaaacagg atcagtaaag 2640
aaggaaaaag cagtaaagcc agaggaaggg cagcttgtgc agctggaaga gaaagggcag 2700
ggttcagtgc cctggtcagt atatggtgtc tacatccagg ctgctggggg ccccttggca 2760
ttcctggtta ttatggccct tttcatgctg aatgtaggca gcaccgcctt cagcacctgg 2820
tggttgagtt actggatcaa gcaaggaagc gggaacacca ctgtgactcg agggaacgag 2880
acctcggtga gtgacagcat gaaggacaat cctcatatgc agtactatgc cagcatctac 2940
gccctctcca tggcagtcat gctgatcctg aaagccattc gaggagttgt ctttgtcaag 3000
ggcacgctgc gagcttcctc ccggctgcat gacgagcttt tccgaaggat ccttcgaagc 3060
cctatgaagt tttttgacac gacccccaca gggaggattc tcaacaggtt ttccaaagac 3120
atggatgaag ttgacgtgcg gctgccgttc caggccgaga tgttcatcca gaacgttatc 3180
ctggtgttct tctgtgtggg aatgatcgca ggagtcttcc cgtggttcct tgtggcagtg 3240
gggccccttg tcatcctctt ttcagtcctg cacattgtct ccagggtcct gattcgggag 3300
ctgaagcgtc tggacaatat cacgcagtca cctttcctct cccacatcac gtccagcata 3360
cagggccttg ccaccatcca cgcctacaat aaagggcagg agtttctgca cagataccag 3420
gagctgctgg atgacaacca agctcctttt tttttgttta cgtgtgcgat gcggtggctg 3480
gctgtgcggc tggacctcat cagcatcgcc ctcatcacca ccacggggct gatgatcgtt 3540
cttatgcacg ggcagattcc cccagcctat gcgggtctcg ccatctctta tgctgtccag 3600
ttaacggggc tgttccagtt tacggtcaga ctggcatctg agacagaagc tcgattcacc 3660
tcggtggaga ggatcaatca ctacattaag actctgtcct tggaagcacc tgccagaatt 3720
aagaacaagg ctccctcccc tgactggccc caggagggag aggtgacctt tgagaacgca 3780
gagatgaggt accgagaaaa cctccctctc gtcctaaaga aagtatcctt cacgatcaaa 3840
cctaaagaga agattggcat tgtggggcgg acaggatcag ggaagtcctc gctggggatg 3900
gccctcttcc gtctggtgga gttatctgga ggctgcatca agattgatgg agtgagaatc 3960
agtgatattg gccttgccga cctccgaagc aaactctcta tcattcctca agagccggtg 4020
ctgttcagtg gcactgtcag atcaaatttg gaccccttca accagtacac tgaagaccag 4080
atttgggatg ccctggagag gacacacatg aaagaatgta ttgctcagct acctctgaaa 4140
cttgaatctg aagtgatgga gaatggggat aacttctcag tgggggaacg gcagctcttg 4200
tgcatagcta gagccctgct ccgccactgt aagattctga ttttagatga agccacagct 4260
gccatggaca cagagacaga cttattgatt caagagacca tccgagaagc atttgcagac 4320
tgtaccatgc tgaccattgc ccatcgcctg cacacggttc taggctccga taggattatg 4380
gtgctggccc agggacaggt ggtggagttt gacaccccat cggtccttct gtccaacgac 4440
agttcccgat tctatgccat gtttgctgct gcagagaaca aggtcgctgt caagggctga 4500
ctcctccctg ttgacgaagt ctcttttctt tagagcattg ccattccctg cctggggcgg 4560
gcccctcatc gcgtcctcct accgaaacct tgcctttctc gattttatct ttcgcacagc 4620
agttccggat tggcttgtgt gtttcacttt tagggagagt catattttga ttattgtatt 4680
tattccatat tcatgtaaac aaaatttagt ttttgttctt aattgcactc taaaaggttc 4740
agggaaccgt tattataatt gtatcagagg cctataatga agctttatac gtgtagctat 4800
atctatatat aattctgtac atagcctata tttacagtga aaatgtaagc tgtttatttt 4860
atattaaaat aagcactgtg ctaataacag tgcatattcc tttctatcat ttttgtacag 4920
tttgctgtac tagagatctg gttttgctat tagactgtag gaagagtagc atttcattct 4980
tctctagctg gtggtttcac ggtgccaggt tttctgggtg tccaaaggaa gacgtgtggc 5040
aatagtgggc cctccgacag ccccctctgc cgcctcccca cggccgctcc aggggtggct 5100
ggagacgggt gggcggctgg agaccatgca gagcgccgtg agttctcagg gctcctgcct 5160
tctgtcctgg tgtcacttac tgtttctgtc aggagagcag cggggcgaag cccaggcccc 5220
ttttcactcc ctccatcaag aatggggatc acagagacat tcctccgagc cggggagttt 5280
ctttcctgcc ttcttctttt tgctgttgtt tctaaacaag aatcagtcta tccacagaga 5340
gtcccactgc ctcaggttcc tatggctggc cactgcacag agctctccag ctccaagacc 5400
tgttggttcc aagccctgga gccaactgct gctttttgag gtggcacttt ttcatttgcc 5460
tattcccaca cctccacagt tcagtggcag ggctcaggat ttcgtgggtc tgttttcctt 5520
tctcaccgca gtcgtcgcac agtctctctc tctctctccc ctcaaagtct gcaactttaa 5580
gcagctcttg ctaatcagtg tctcacactg gcgtagaagt ttttgtactg taaagagacc 5640
tacctcaggt tgctggttgc tgtgtggttt ggtgtgttcc cgcaaacccc ctttgtgctg 5700
tggggctggt agctcaggtg ggcgtggtca ctgctgtcat caattgaatg gtcagcgttg 5760
catgtcgtga ccaactagac attctgtcgc cttagcatgt ttgctgaaca ccttgtggaa 5820
gcaaaaatct gaaaatgtga ataaaattat tttggatttt gtaaaaaaaa aa 5872
<210> 73
<211> 2520
<212> DNA
<213> 智人
<400> 73
ggatggttgt ctattaactt gttcaaaaaa gtatcaggag ttgtcaaggc agagaagaga 60
gtgtttgcaa aagggggaaa gtagtttgct gcctctttaa gactaggact gagagaaaga 120
agaggagaga gaaagaaagg gagagaagtt tgagccccag gcttaagcct ttccaaaaaa 180
taataataac aatcatcggc ggcggcagga tcggccagag gaggagggaa gcgctttttt 240
tgatcctgat tccagtttgc ctctctcttt ttttccccca aattattctt cgcctgattt 300
tcctcgcgga gccctgcgct cccgacaccc ccgcccgcct cccctcctcc tctccccccg 360
cccgcgggcc ccccaaagtc ccggccgggc cgagggtcgg cggccgccgg cgggccgggc 420
ccgcgcacag cgcccgcatg tacaacatga tggagacgga gctgaagccg ccgggcccgc 480
agcaaacttc ggggggcggc ggcggcaact ccaccgcggc ggcggccggc ggcaaccaga 540
aaaacagccc ggaccgcgtc aagcggccca tgaatgcctt catggtgtgg tcccgcgggc 600
agcggcgcaa gatggcccag gagaacccca agatgcacaa ctcggagatc agcaagcgcc 660
tgggcgccga gtggaaactt ttgtcggaga cggagaagcg gccgttcatc gacgaggcta 720
agcggctgcg agcgctgcac atgaaggagc acccggatta taaataccgg ccccggcgga 780
aaaccaagac gctcatgaag aaggataagt acacgctgcc cggcgggctg ctggcccccg 840
gcggcaatag catggcgagc ggggtcgggg tgggcgccgg cctgggcgcg ggcgtgaacc 900
agcgcatgga cagttacgcg cacatgaacg gctggagcaa cggcagctac agcatgatgc 960
aggaccagct gggctacccg cagcacccgg gcctcaatgc gcacggcgca gcgcagatgc 1020
agcccatgca ccgctacgac gtgagcgccc tgcagtacaa ctccatgacc agctcgcaga 1080
cctacatgaa cggctcgccc acctacagca tgtcctactc gcagcagggc acccctggca 1140
tggctcttgg ctccatgggt tcggtggtca agtccgaggc cagctccagc ccccctgtgg 1200
ttacctcttc ctcccactcc agggcgccct gccaggccgg ggacctccgg gacatgatca 1260
gcatgtatct ccccggcgcc gaggtgccgg aacccgccgc ccccagcaga cttcacatgt 1320
cccagcacta ccagagcggc ccggtgcccg gcacggccat taacggcaca ctgcccctct 1380
cacacatgtg agggccggac agcgaactgg aggggggaga aattttcaaa gaaaaacgag 1440
ggaaatggga ggggtgcaaa agaggagagt aagaaacagc atggagaaaa cccggtacgc 1500
tcaaaaagaa aaaggaaaaa aaaaaatccc atcacccaca gcaaatgaca gctgcaaaag 1560
agaacaccaa tcccatccac actcacgcaa aaaccgcgat gccgacaaga aaacttttat 1620
gagagagatc ctggacttct ttttggggga ctatttttgt acagagaaaa cctggggagg 1680
gtggggaggg cgggggaatg gaccttgtat agatctggag gaaagaaagc tacgaaaaac 1740
tttttaaaag ttctagtggt acggtaggag ctttgcagga agtttgcaaa agtctttacc 1800
aataatattt agagctagtc tccaagcgac gaaaaaaatg ttttaatatt tgcaagcaac 1860
ttttgtacag tatttatcga gataaacatg gcaatcaaaa tgtccattgt ttataagctg 1920
agaatttgcc aatatttttc aaggagaggc ttcttgctga attttgattc tgcagctgaa 1980
atttaggaca gttgcaaacg tgaaaagaag aaaattattc aaatttggac attttaattg 2040
tttaaaaatt gtacaaaagg aaaaaattag aataagtact ggcgaaccat ctctgtggtc 2100
ttgtttaaaa agggcaaaag ttttagactg tactaaattt tataacttac tgttaaaagc 2160
aaaaatggcc atgcaggttg acaccgttgg taatttataa tagcttttgt tcgatcccaa 2220
ctttccattt tgttcagata aaaaaaacca tgaaattact gtgtttgaaa tattttctta 2280
tggtttgtaa tatttctgta aatttattgt gatattttaa ggttttcccc cctttatttt 2340
ccgtagttgt attttaaaag attcggctct gtattatttg aatcagtctg ccgagaatcc 2400
atgtatatat ttgaactaat atcatcctta taacaggtac attttcaact taagttttta 2460
ctccattatg cacagtttga gataaataaa tttttgaaat atggacactg aaaaaaaaaa 2520
<210> 74
<211> 2032
<212> DNA
<213> 智人
<400> 74
ggactctggg acgctcagac gccgcgcggg gcggggattg gtctgtggtc ctctctcggc 60
tcctcgcggc tcgcggcggc cgacggttcc tgggacacct gcttgcttgg cccgtccggc 120
ggctcagggc ttctctgctg cgctcccggt tcgctggacg ggaagaaggg ctgggccgtc 180
ccgtcccgtc cccatcggaa ccccaagtcg cgccgctgac ccgtcgcagg gcgagatgag 240
cgcggacgca gcggccgggg cgcccctgcc ccggctctgc tgcctggaga agggtccgaa 300
cggctacggc ttccacctgc acggggagaa gggcaagttg ggccagtaca tccggctggt 360
ggagcccggc tcgccggccg agaaggcggg gctgctggcg ggggaccggc tggtggaggt 420
gaacggcgaa aacgtggaga aggagaccca ccagcaggtg gtgagccgca tccgcgccgc 480
actcaacgcc gtgcgcctgc tggtggtcga ccccgagacg gacgagcagc tgcagaagct 540
cggcgtccag gtccgagagg agctgctgcg cgcccaggaa gcgccggggc aggccgagcc 600
gccggccgcc gccgaggtgc agggggctgg caacgaaaat gagcctcgcg aggccgacaa 660
gagccacccg gagcagcgcg agcttcggcc tcggctctgt accatgaaga agggccccag 720
tggctatggc ttcaacctgc acagcgacaa gtccaagcca ggccagttca tccggtcagt 780
ggacccagac tccccggctg aggcttcagg gctccgggcc caggatcgca ttgtggaggt 840
gaacggggtc tgcatggagg ggaagcagca tggggacgtg gtgtccgcca tcagggctgg 900
cggggacgag accaagctgc tggtggtgga cagggaaact gacgagttct tcaagaaatg 960
cagagtgatc ccatctcagg agcacctgaa tggtcccctg cctgtgccct tcaccaatgg 1020
ggagatacag aaggagaaca gtcgtgaagc cctggcagag gcagccttgg agagccccag 1080
gccagccctg gtgagatccg cctccagtga caccagcgag gagctgaatt cccaagacag 1140
ccccccaaaa caggactcca cagcgccctc gtctacctcc tcctccgacc ccatcctaga 1200
cttcaacatc tccctggcca tggccaaaga gagggcccac cagaaacgca gcagcaaacg 1260
ggccccgcag atggactgga gcaagaaaaa cgaactcttc agcaacctct gagcgccctg 1320
ctgccaccca gtgactggca gggccgagcc agcattccac cccacctttt tccttctccc 1380
caattactcc cctgaatcaa tgtacaaatc agcacccaca tcccctttct tgacaaatga 1440
tttttctaga gaactatgtt cttccctgac tttagggaag gtgaatgtgt tcccgtcctc 1500
ccgcagtcag aaaggagact ctgcctccct cctcctcact gagtgcctca tcctaccggg 1560
tgtccctttg ccaccctgcc tgggacatcg ctggaacctg caccatgcca ggatcatggg 1620
accaggcgag agggcaccct cccttcctcc cccatgtgat aaatgggtcc agggctgatc 1680
aaagaactct gactgcagaa ctgccgctct cagtggacag ggcatctgtt accctgagac 1740
ctgtggcaga cacgtcttgt tttcatttga tttttgttaa gagtgcagta ttgcagagtc 1800
tagaggaatt tttgtttcct tgattaacat gattttcctg gttgttacat ccagggcatg 1860
gcagtggcct cagccttaaa cttttgttcc tactcccacc ctcagcgaac tgggcagcac 1920
ggggagggtt tggctacccc tgcccatccc tgagccaggt accaccattg taaggaaaca 1980
ctttcagaaa ttcagctggt tcctccaaac ccttcaaaaa aaaaaaaaaa aa 2032
<210> 75
<211> 3583
<212> DNA
<213> 智人
<400> 75
gcggccgccc tgcgcgcgaa gctcgtggcc cgagaggggt gcggtcgggc cgacggaggc 60
ggggccctgg ctgcctctct ccctgctcat aggctggccg ctcaggcctg gccggcctcg 120
gggcctcggg attcgcggcg gcgctgccaa tcaggcgatc gggccccgcc cccccggagt 180
tgggtgaaat agaggcgggc gtcaagtgtc agtagtcgcg gggcaggtac gtgcgctcgc 240
ggttctctcg cggaggtcgg cggtggcggg agcgggctcc ggagagcctg agagcacggt 300
ggggcggggc gggagaaagt ggccgcccgg aggacgttgg cgtttacgtg tggaagagcg 360
gaagagtttt gcttttcgtg cgcgccttcg aaaactgcct gccgctgtct gaggagtcca 420
cccgaaacct cccctcctcc gccggcagcc ccgcgctgag ctcgccgacc caagccagcg 480
tgggcgaggt gggaagtgcg cccgacccgc gcctggagct gcgcccccga gtgcccatgg 540
ctacaagggt gctgagcatg agcgcccgcc tgggacccgt gccccagccg ccggcgccgc 600
aggacgagcc ggtgttcgcg cagctcaagc cggtgctggg cgccgcgaat ccggcccgcg 660
acgcggcgct cttccccggc gaggagctga agcacgcgca ccaccgcccg caggcgcagc 720
ccgcgcccgc gcaggccccg cagccggccc agccgcccgc caccggcccg cggctgcctc 780
cagaggacct ggtccagaca agatgtgaaa tggagaagta tctgacacct cagcttcctc 840
cagttcctat aattccagag cataaaaagt atagacgaga cagtgcctca gtcgtagacc 900
agttcttcac tgacactgaa gggttacctt acagtatcaa catgaacgtc ttcctccctg 960
acatcactca cctgagaact ggcctctaca aatcccagag accgtgcgta acacacatca 1020
agacagaacc tgttgccatt ttcagccacc agagtgaaac gactgcccct cctccggccc 1080
cgacccaggc cctccctgag ttcaccagta tattcagctc acaccagacc gcagctccag 1140
aggtgaacaa tattttcatc aaacaagaac ttcctacacc agatcttcat ctttctgtcc 1200
ctacccagca gggccacctg taccagctac tgaatacacc ggatctagat atgcccagtt 1260
ctacaaatca gacagcagca atggacactc ttaatgtttc tatgtcagct gccatggcag 1320
gccttaacac acacacctct gctgttccgc agactgcagt gaaacaattc cagggcatgc 1380
ccccttgcac atacacaatg ccaagtcagt ttcttccaca acaggccact tactttcccc 1440
cgtcaccacc aagctcagag cctggaagtc cagatagaca agcagagatg ctccagaatt 1500
taaccccacc tccatcctat gctgctacaa ttgcttctaa actggcaatt cacaatccaa 1560
atttacccac caccctgcca gttaactcac aaaacatcca acctgtcaga tacaatagaa 1620
ggagtaaccc cgatttggag aaacgacgca tccactactg cgattaccct ggttgcacaa 1680
aagtttatac caagtcttct catttaaaag ctcacctgag gactcacact ggtgaaaagc 1740
catacaagtg tacctgggaa ggctgcgact ggaggttcgc gcgatcggat gagctgaccc 1800
gccactaccg gaagcacaca ggcgccaagc ccttccagtg cggggtgtgc aaccgcagct 1860
tctcgcgctc tgaccacctg gccctgcata tgaagaggca ccagaactga gcactgcccg 1920
tgtgacccgt tccaggtccc ctgggctccc tcaaatgaca gacctaacta ttcctgtgta 1980
aaaacaacaa aaacaaacaa aagcaagaaa accacaacta aaactggaaa tgtatatttt 2040
gtatatttga gaaaacaggg aatacattgt attaatacca aagtgtttgg tcattttaag 2100
aatctggaat gcttgctgta atgtatatgg ctttactcaa gcagatctca tctcatgaca 2160
ggcagccacg tctcaacatg ggtaaggggt gggggtggag gggagtgtgt gcagcgtttt 2220
tacctaggca ccatcattta atgtgacagt gttcagtaaa caaatcagtt ggcaggcacc 2280
agaagaagaa tggattgtat gtcaagattt tacttggcat tgagtagttt ttttcaatag 2340
taggtaattc cttagagata cagtatacct ggcaattcac aaatagccat tgaacaaatg 2400
tgtgggtttt taaaaattat atacatatat gagttgccta tatttgctat tcaaaatttt 2460
gtaaatatgc aaatcagctt tataggttta ttacaagttt tttaggattc ttttggggaa 2520
gagtcataat tcttttgaaa ataaccatga atacacttac agttaggatt tgtggtaagg 2580
tacctctcaa cattaccaaa atcatttctt tagagggaag gaataatcat tcaaatgaac 2640
tttaaaaaag caaatttcat gcactgatta aaataggatt attttaaata caaaaggcat 2700
tttatatgaa ttataaactg aagagcttaa agatagttac aaaatacaaa agttcaacct 2760
cttacaataa gctaaacgca atgtcatttt taaaaagaag gacttagggt gtcgttttca 2820
catatgacaa tgttgcattt atgatgcagt ttcaagtacc aaaacgttga attgatgatg 2880
cagttttcat atatcgagat gttcgctcgt gcagtactgt tggttaaatg acaatttatg 2940
tggattttgc atgtaataca cagtgagaca cagtaatttt atctaaatta cagtgcagtt 3000
tagttaatct attaatactg actcagtgtc tgcctttaaa tataaatgat atgttgaaaa 3060
cttaaggaag caaatgctac atatatgcaa tataaaatag taatgtgatg ctgatgctgt 3120
taaccaaagg gcagaataaa taagcaaaat gccaaaaggg gtcttaattg aaatgaaaat 3180
ttaattttgt ttttaaaata ttgtttatct ttatttattt tgtggtaata tagtaagttt 3240
ttttagaaga caattttcat aacttgataa attatagttt tgtttgttag aaaagttgct 3300
cttaaaagat gtaaatagat gacaaacgat gtaaataatt ttgtaagagg cttcaaaatg 3360
tttatacgtg gaaacacacc tacatgaaaa gcagaaatcg gttgctgttt tgcttctttt 3420
tccctcttat ttttgtattg tggtcatttc ctatgcaaat aatggagcaa acagctgtat 3480
agttgtagaa ttttttgaga gaatgagatg tttatatatt aacgacaatt ttttttttgg 3540
aaaataaaaa gtgcctaaaa gatgtaaaaa aaaaaaaaaa aaa 3583
<210> 76
<211> 1105
<212> DNA
<213> 智人
<400> 76
cttgttcaaa cagcacttac aggtggggac ctgtttttgc taagtcatcc tggggatgct 60
caaagctcca ttgttagatc ctttctgtcc tccttcctgg ctcctccttc ctccccaccc 120
ctctaatagg ctcataagtg ggctcaggcc tctctgcggg gctcactctg cgcttcacca 180
tggctttcat tgccaagtcc ttctatgacc tcagtgccat cagcctggat ggggagaagg 240
tagatttcaa tacgttccgg ggcagggccg tgctgattga gaatgtggct tcgctctgag 300
gcacaaccac ccgggacttc acccagctca acgagctgca atgccgcttt cccaggcgcc 360
tggtggtcct tggcttccct tgcaaccaat ttggacatca ggagaactgt cagaatgagg 420
agatcctgaa cagtctcaag tatgtccgtc ctgggggtgg ataccagccc accttcaccc 480
ttgtccaaaa atgtgaggtg aatgggcaga acgagcatcc tgtcttcgcc tacctgaagg 540
acaagctccc ctacccttat gatgacccat tttccctcat gaccgatccc aagctcatca 600
tttggagccc tgtgcgccgc tcagatgtgg cctggaactt tgagaagttc ctcatagggc 660
cggagggaga gcccttccga cgctacagcc gcaccttccc aaccatcaac attgagcctg 720
acatcaagcg cctccttaaa gttgccatat agatgtgaac tgctcaacac acagatctcc 780
tactccatcc agtcctgagg agccttagga tgcagcatgc cttcaggaga cactgctgga 840
cctcagcatt cccttgatat cagtcccctt cactgcagag ccttgccttt cccctctgcc 900
tgtttccttt tcctctccca accctctggt tggtgattca acttgggctc caagacttgg 960
gtaagctctg ggccttcaca gaatgatggc accttcctaa accctcatgg gtggtgtctg 1020
agaggcgtga agggcctgga gccactctgc tagaagagac caataaaggg caggtgtgga 1080
aacggccaaa aaaaaaaaaa aaaaa 1105
<210> 77
<211> 1576
<212> DNA
<213> 智人
<400> 77
agttaaaaac agatttccca caagaccgac cggagcgccg atcagagcac ctgcccgggc 60
cacacatttc ctcctggagc acagcaagtg ccgcctaaat tacccgagtg agcatctctt 120
cccggcacga gaggcaggga ggccaaaggg ccgccaagct ggcctgggag aggcgtaggg 180
cggagcgaga gtggagtgac attcccgagg gcggagcccc agggcctccg agacccgtag 240
actcccgcct cccgcctcct ctaggccgcc ggccgcgaag cgctgagtca cggtgaggct 300
actggaccca cactctctta acctgccctc cctgcactcg ctcccggcgg ctcttcgcgt 360
cacccccgcc gctaaggctc caggtgccgc taccgcagcg tgagtacctg gggctcctgc 420
aggggtccac tagccctcca tcctctacag ctcagcatca gaacactctc tttttagact 480
ccgatatggg gtcctccaag aaagttactc tctcagtgct cagccgggag cagtcggaag 540
gggttggagc gagggtccgg agaagcattg gcagacccga gttaaaaaat ctggatccgt 600
ttttactgtt tgatgaattt aaaggaggta gaccaggagg atttcctgat catccacatc 660
gaggttttga aacagtatcc tacctcctgg aagggggcag catggcccat gaagacttct 720
gtggacacac tggtaaaatg aacccaggag atttgcagtg gatgactgcg ggccggggca 780
ttctgcacgc tgagatgcct tgctcagagg agccagccca tggcctacaa ctgtgggtta 840
atttgaggag ctcagagaag atggtggagc ctcagtacca ggaactgaaa agtgaagaaa 900
tccctaaacc cagtaaggat ggtgtgacag ttgctgtcat ttctggagaa gccctgggaa 960
taaagtccaa ggtttacact cgcacaccaa ccttatattt ggacttcaaa ttggacccag 1020
gagccaaaca ttcccaacct atccctaaag ggtggacaag cttcatttac acgatatctg 1080
gagatgtgta tattgggccc gatgatgcac aacaaaaaat agaacctcat cacacagcag 1140
tgcttggaga aggtgacagt gtccaggtgg agaacaagga tcccaagaga agccactttg 1200
tcttaattgc tggggagcca ttaagagaac cagttatcca acatggtcca tttgtgatga 1260
acaccaatga agagatttct caagctattc ttgatttcag aaacgcaaaa aatgggtttg 1320
aaagggccaa aacctggaaa tcaaagattg ggaactagtg gaaagcggaa gagcaggtct 1380
tgatgtgtcc tagaattttg ccatttctga gattgagcca ttgaaggcat tccatttcta 1440
aagcttattt agccggtgct tctaaagaat tccacactaa cgtgataaca tggtttttgt 1500
aacaataaat gtaggatatt tcctggcaca tgcaaataaa cctaatcatt gtttctttaa 1560
aaaaaaaaaa aaaaaa 1576
<210> 78
<211> 2298
<212> DNA
<213> 智人
<400> 78
cagcttggtt tgggccaggt ggactggaag gggcggaggt aaccagaagc ggctagtggc 60
ggctgcctgc gtccccaacc ccctccgcgc agcgctcgcg acacgcgtgc caggagtggg 120
agcgagcggc ggggccagct gcgttctgag cctgggcgca gctgccatct gctctgggaa 180
gcaccagggt gtccccgccg ccctcagctc gaagtcagcc accatggagg cgcaggcaca 240
aggtttgttg gagactgaac cgttgcaagg aacagacgaa gatgcagtag ccagtgctga 300
cttctctagc atgctctctg aggaggaaaa ggaagagtta aaagcagagt tagttcagct 360
agaagacgaa attacaacac tacgacaagt tttgtcagcg aaagaaaggc atctagttga 420
gataaaacaa aaactcggca tgaacctgat gaatgaatta aaacagaact tcagcaaaag 480
ctggcatgac atgcagacta ccactgccta caagaaaaca catgaaaccc tgagtcacgc 540
agggcaaaag gcaactgcag ctttcagcaa cgttggaacg gccatcagca agaagttcgg 600
agacatgagt tactccattc gccattccat aagtatgcct gctatgagga attctcctac 660
tttcaaatca tttgaggaga gggttgagac aactgtcaca agcctcaaga cgaaagtagg 720
cggtacgaac cctaatggag gcagttttga ggaggtcctc agctccacgg cccatgccag 780
tgcccagagc ttggcaggag gctcccggcg gaccaaggag gaggagctgc agtgctaagt 840
ccagccagcg tgcagctgca tccagaaacc ggccactacc cagcccatct ctgcctgtgc 900
ttatccagat aagaagacca aaatcccgct gggaaaaacc caggccttga cattgttatt 960
caaatggccc ctccagaaag tttaatgatt tccatttgta tttgtgttga tgatggacca 1020
cttgaccatc acatttcagt attcatagat gactgtcaca ttttaaaatg ttcccacttg 1080
agcaggtaca caactggtca taattcctgt ctgtgtaatt cgatgtatat ttttccaaac 1140
atgtagctat tgtttgcttt gatttttgct tggcctcctt tatgatgtgc atgtccttga 1200
aggctgaatg aacagtccct ttcagttcag cagatcaaca ggatggagct cttcatgact 1260
gtctccagca ataggatgat ttactataaa tttcatccaa ctacttgtga tctctctcac 1320
ctacatcaat tatgtatgtt aatttcagca attaaaagaa ttgattttaa tgactttgaa 1380
ttcttaattt ctttgtctta aaagttgcta gttatgattt tacagatgca attttaaatc 1440
aacttttagc caggtgcggc ggctcacacc tgtaatccca actattttgg atgccaaggt 1500
gagaggattg cttgaggcca ggagttaaag atcagcctgg gcaacacaga ccctgtctct 1560
acaaaaaaag aaaaaaatta gccagacata gtgttgcttg cctgtagtcc cagctactct 1620
agaggctgag gcaggaggat tgcatgagcc taggagttcg aaactgcagt gagctatgat 1680
tgcaccactg cactactcca gcctgggtga cagagtggga cactgtctcc aaaaatagta 1740
ataataagta gtcaactttt actgctaatt tggtgaacat gagagaggat atgaaaataa 1800
atattacctc agctatccta ggatgttaaa ataatctcca attttaaaat tctctccaat 1860
ctacatacag tagtagttag tcagataaag gatatccaaa aaagagatag ctagaaaatg 1920
ggagaagcag agttctgcaa cccctttcag tttgtaaatt gttcacatgt atgaaaataa 1980
ctggtattta tcaatccact cagatttctg cactaacttt tatcttatat atcatatgta 2040
tctcttttct ttttctaaat gggaacatat atttgttatt aggtggcaga gatatagcct 2100
taagatatat ttgtaaaatg cacactgaat agacatccaa cctaaaaaaa atcactattt 2160
aaaaagccca tataatatat acatatttgt tagcatgcta attgttcatg ttttgtgttt 2220
attaaataga agtgatatat atgacatttt gaagtaaagc acatctgaaa aattctactc 2280
aaaaaaaaaa aaaaaaaa 2298
<210> 79
<211> 3580
<212> DNA
<213> 智人
<400> 79
gccgggcccc gccgccgccc gcgcgccccc gggcccccga cacacatgag attcttcagg 60
ctcactttca agtgcttcgt ggactgcttc tgactgcgcc gcccgcgccc cgcaccccgc 120
cgcccgcccg ccgccccgtc ccccggcccg gccgcccccc ggcccccggc cggcccgcgc 180
cctcggggcc ctccccggtg ccgccggtgc cccccgcctg accgccgccc cccgtgaggc 240
gccgcgaccc cggcccggcc gtgcggcccg ccgaggccat ggcgaagaag agcgccgaga 300
acggcatcta tagcgtgtcc ggcgacgaga agaagggccc cctcatcgcg cccgggcccg 360
acggggcccc ggccaagggc gacggccccg tgggcctggg gacacccggc ggccgcctgg 420
ccgtgccgcc gcgcgagacc tggacgcgcc agatggactt catcatgtcg tgcgtgggct 480
tcgccgtggg cttgggcaac gtgtggcgct tcccctacct gtgctacaag aacggcggag 540
gtgtgttcct tattccctac gtcctgatcg ccctggttgg aggaatcccc attttcttct 600
tagagatctc gctgggccag ttcatgaagg ccggcagcat caatgtctgg aacatctgtc 660
ccctgttcaa aggcctgggc tacgcctcca tggtgatcgt cttctactgc aacacctact 720
acatcatggt gctggcctgg ggcttctatt acctggtcaa gtcctttacc accacgctgc 780
cctgggccac atgtggccac acctggaaca ctcccgactg cgtggagatc ttccgccatg 840
aagactgtgc caatgccagc ctggccaacc tcacctgtga ccagcttgct gaccgccggt 900
cccctgtcat cgagttctgg gagaacaaag tcttgaggct gtctggggga ctggaggtgc 960
caggggccct caactgggag gtgacccttt gtctgctggc ctgctgggtg ctggtctact 1020
tctgtgtctg gaagggggtc aaatccacgg gaaagatcgt gtacttcact gctacattcc 1080
cctacgtggt cctggtcgtg ctgctggtgc gtggagtgct gctgcctggc gccctggatg 1140
gcatcattta ctatctcaag cctgactggt caaagctggg gtcccctcag gtgtggatag 1200
atgcggggac ccagattttc ttttcttacg ccattggcct gggggccctc acagccctgg 1260
gcagctacaa ccgcttcaac aacaactgct acaaggacgc catcatcctg gctctcatca 1320
acagtgggac cagcttcttt gctggcttcg tggtcttctc catcctgggc ttcatggctg 1380
cagagcaggg cgtgcacatc tccaaggtgg cagagtcagg gccgggcctg gccttcatcg 1440
cctacccgcg ggctgtcacg ctgatgccag tggccccact ctgggctgcc ctgttcttct 1500
tcatgctgtt gctgcttggt ctcgacagcc agtttgtagg tgtggagggc ttcatcaccg 1560
gcctcctcga cctcctcccg gcctcctact acttccgttt ccaaagggag atctctgtgg 1620
ccctctgttg tgccctctgc tttgtcatcg atctctccat ggtgactgat ggcgggatgt 1680
acgtcttcca gctgtttgac tactactcgg ccagcggcac caccctgctc tggcaggcct 1740
tttgggagtg cgtggtggtg gcctgggtgt acggagctga ccgcttcatg gacgacattg 1800
cctgtatgat cgggtaccga ccttgcccct ggatgaaatg gtgctggtcc ttcttcaccc 1860
cgctggtctg catgggcatc ttcatcttca acgttgtgta ctacgagccg ctggtctaca 1920
acaacaccta cgtgtacccg tggtggggtg aggccatggg ctgggccttc gccctgtcct 1980
ccatgctgtg cgtgccgctg cacctcctgg gctgcctcct cagggccaag ggcaccatgg 2040
ctgagcgctg gcagcacctg acccagccca tctggggcct ccaccacttg gagtaccgag 2100
ctcaggacgc agatgtcagg ggcctgacca ccctgacccc agtgtccgag agcagcaagg 2160
tcgtcgtggt ggagagtgtc atgtgacaac tcagctcaca tcaccagctc acctctggta 2220
gccatagcag cccctgcttc agccccaccg cacccctcca gggggcctgc ctttccctga 2280
cacttttggg gtctgcctgg gggaggaggg gagaaagcac catgagtgct cactaaaaca 2340
actttttcca tttttaataa aacgccaaaa atatcacaac ccaccaaaaa tagatgcctc 2400
tccccctcca gccctagccg agctggtcct aggccccgcc tagtgcccca cccccaccca 2460
cagtgctgca ctcctcctgc ccctgccacg cccaccccct gcccacctct ccaggctctg 2520
ctctgcagca cacccgtggg tgacccctca ccccagaagc agcagtggca gcttgggaaa 2580
tgtgaggaag ggaaggaggg agagacggga gggaggagag agaggagaag ggaggcaggg 2640
gaggggcagc agaaccaagg caaatatttc agctgggcta tacccctctc cccatccctg 2700
ttatagaagc ttagagagcc agccagcaat ggaaccttct ggttcctgcg ccaatcgcca 2760
ccagtatcaa ttgtgtgagc ttgggtgcga gtgcacgcgt gcgtgagtac ggagagtata 2820
tatagatctc tatctcttag caaaggtgaa tgccagatgt aaatggcgcc tctgggcaaa 2880
ggaggcttgt attttgcaca ttttataaaa acttgagaga atgagatttc tgcttgtata 2940
tttctaaaaa gaggaaggag cccaaaccat cctctcctta ccactcccat ccctgtgagc 3000
cctaccttac ccctctgccc ctagccaagg agtgtgaatt tatagatcta actttcatag 3060
gcaaaacaaa agcttcgagc tgttgcgtgt gtgagtctgt tgtgtggatg tgcgtgtgtg 3120
gtccccagcc ccagactgga ttggaaaagt gcatggtggg ggcctcgggg ctgtccccac 3180
gctgtccctt tgccacaagt ctgtggggca agaggctgca atattccgtc ctgggtgtct 3240
gggctgctaa cctggcctgc tcaggcttcc caccctgtgc ggggcacacc cccaggaagg 3300
gaccctggac acggctccca cgtccaggct taaggtggat gcacttcccg cacctccagt 3360
cttctgtgta gcagctttaa cccacgtttg tctgtcacgt ccagtcccga gacggctgag 3420
tgaccccaag aaaggcttcc ccgacaccca gacagaggct gcagggctgg ggctgggtga 3480
gggtggcggg cctgcgggga cattctactg tgctaaaaag ccactgcaga catagcaata 3540
aaaacatgtc attttccaaa gcaggaaaaa aaaaaaaaaa 3580
<210> 80
<211> 2632
<212> DNA
<213> 智人
<400> 80
agctgaggga cgcgtcagcc aggcaccccg gggtgtggcc agaggacttc ggcgacgctt 60
ccccgagagt agcccccctc ctcaacccag aaaagacaac cccgcggggc tgcagcgagc 120
caggcatgct cactggcgca ggcccggccc gcagcccgag caggaagcgc cggcgctagg 180
cggccccctg cgctgccagc tggagccggg cggagccagc gccccggcgc agggtggctc 240
tgccagtccc cgcgcgcctg ggcggccgca cacgtgtcca ggcgtcacgt ccgcgcgcgc 300
ccccggggct tgcgtcagcg gctgttccag aagcgggtgg gccagggctc tgcgcaccgc 360
tggggttcgg ggcccgggac gccgccggga ggagggcacc gcgcggggtc cgacgcggag 420
gcgtgctcgg aacgccgggg gctgcggagt gcatcagcgc ggtccagccc tccgcctgcc 480
gggcgccgag cgtctccgcc gcccggacct gggctgggcg ccgtggcgtt gcctcggagc 540
tcgctgcccg cggggcgcgc accgccttga cccgggcggc cccgcggcag gcaggcgccc 600
gcagttccat ggttggttcg gagcgcgatg agccgcccgt cctccaccgg ccccagcgct 660
aataaaccct gcagcaagca gccgccgccg cagccccagc acactccgtc cccggctgcg 720
cccccggccg ccgccaccat ctcggctgcg ggccccggct cgtccgcggt gcccgccgcg 780
gcggcggtga tctcgggccc cggcggcggc ggcggggccg gcccggtgtc cccgcagcac 840
cacgagctga cctcgctctt cgagtgtccg gtctgctttg actatgtcct gcctcctatt 900
ctgcagtgcc aggccgggca cctggtgtgt aaccaatgcc gccagaagtt gagctgctgc 960
ccgacgtgca ggggcgccct gacgcccagc atcaggaacc tggctatgga gaaggtggcc 1020
tcggcagtcc tgtttccctg taagtatgcc accacgggct gttccctgac cctgcaccat 1080
acggagaaac cagaacatga agacatatgt gaataccgtc cctactcctg cccatgtcct 1140
ggtgcttcct gcaagtggca ggggtccctg gaagctgtga tgtcccatct catgcacgcc 1200
cacaagagca ttaccaccct tcagggagaa gacatcgtct ttctagctac agacattaac 1260
ttgccagggg ctgtcgactg ggtgatgatg cagtcatgtt ttggccatca cttcatgctg 1320
gtgctggaga aacaagagaa gtacgaaggc caccagcagt tttttgccat cgtcctgctc 1380
attggcaccc gcaagcaagc cgagaacttt gcctacagac tggagttgaa tgggaaccgg 1440
cggagattga cctgggaggc cacgccccgt tcgattcatg acggtgtggc tgcggccatc 1500
atgaacagcg actgccttgt tttcgacaca gccatagcac atctttttgc agataatggg 1560
aaccttggaa tcaatgttac tatttctaca tgttgtccat gatgtgactt tcgtaaacct 1620
tcaaaattat ttgggcatag tgctctatgt ttaataaagg tttttataga tgttttattc 1680
catatgtctt cacaagtcag gacccacaat tacccgtgtt ttgtttgaac agcagtgtcc 1740
catctggctt cgacccaaca aagttcatta acctgggatg aatggggttg gcctgttggt 1800
gatttggatg ctgttctgtg atctaaaaca actcttattg aattgtattt actccctaaa 1860
caacacttga caggctgttg cacagggctt ctatagatca gtgtgttagg aatgggaggc 1920
cccttcctgc ctgccttccc atattggtcc cttgacattg acaaaagcac agtgactgtc 1980
agcagattcc tttacttttg tttgtgggag gtaggaattg ttttaatgca ttttaaacag 2040
tgtttctgaa attggatggc tggctaatag acactgaatc acccggagtg cttatcttaa 2100
aattgcagat ttagggagcc tgccaattta acagtctcat caggtgattc ttttcaacag 2160
taatgtttga gaattactgg gttaaattgt gggaaagggt ccagatttta aaggtgcttt 2220
aaggttgccc tctgccgata ctgtttgtct ttctactgtt tcatccccta acttccccca 2280
accctcaaat taaaactaga actatagatc cacatgaacg cacgcctgag atttggccac 2340
tcacctatgt tttgggtgga ttgcctagga aagcaagtca tatggccatt gatagttctc 2400
atgtaattag ttttgctcac cactagtaca gatgacccgt ttacacgtgg cttccctcgg 2460
aagccctcct caacagtagc tggtgtgaaa gactaaatca gtagagttgg aaaagcttta 2520
taaccggtgt gtcatatgct tgctatttaa agctgtgtgt tggttttgtt tttctgccac 2580
attcactagt tttttaataa atattttcca aaaatggata aaaaaaaaaa aa 2632

Claims (20)

1.多种寡核苷酸在制备在用于确定从患者获得的肺组织样品的鳞状细胞癌(SQ)亚型的方法中使用的试剂或试剂盒中的用途,该多种寡核苷酸中的每种与表1的多种分类器生物标记物中的一种的核酸分子互补,该方法包括检测表1的多种分类器生物标记物的表达水平,其中对该多种分类器生物标记物的表达水平的检测特异性地鉴定基底、经典、分泌或原发SQ亚型,其中所述多种分类器生物标记物由表1的所有分类器生物标记物组成。
2.根据权利要求1所述的用途,其中该方法还包括将检测到的表1的该多种分类器生物标记物的表达水平与至少一个样品训练集中的表1的该多种分类器生物标记物的表达进行比较,其中该至少一个样品训练集包含来自参考基底型SQ样品的表1的该多种分类器生物标记物的表达数据、来自参考经典型SQ样品的表1的该多种分类器生物标记物的表达数据、来自参考分泌型SQ样品的表1的该多种分类器生物标记物的表达数据、来自参考原发型SQ样品的表1的该多种分类器生物标记物的表达数据或其组合;并且基于该比较步骤的结果将该样品分类为基底、经典、分泌或原发亚型。
3.根据权利要求2所述的用途,其中该比较步骤包括应用统计算法,该统计算法包括确定从该样品获得的表达水平数据与来自该至少一个训练集的表达水平数据之间的相关性;并且基于该统计算法的结果将该样品分类为基底、经典、分泌或原发亚型。
4.根据上述权利要求中任一项所述的用途,其中在核酸水平上检测该多种分类器生物标记物的该表达水平,其中该核酸水平是RNA或cDNA。
5.根据权利要求4所述的用途,其中对表达水平的该检测包括进行定量实时逆转录酶聚合酶链反应(qRT-PCR)、RNAseq、微阵列、基因芯片、nCounter基因表达测定、基因表达系列分析(SAGE)、基因表达快速分析(RAGE)、核酸酶保护测定、Northern印迹或任何其他等同的基因表达检测技术。
6.根据权利要求5所述的用途,其中通过进行qRT-PCR检测该表达水平。
7.根据权利要求6所述的用途,其中对该表达水平的该检测包括使用对表1 的多种分类器生物标记物中的每种有特异性的至少一对寡核苷酸引物。
8.根据权利要求1所述的用途,其中该样品是从该患者获得的***固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。
9.根据权利要求8所述的用途,其中该体液是血液或其部分、尿液、唾液或痰液。
10.多种寡核苷酸在制备在用于确定从患者获得的肺组织样品的鳞状细胞癌(SQ)亚型的方法中使用的试剂或试剂盒中的用途,该多种寡核苷酸中的每种与表1中列出的多种分类器生物标记物中的一种的核酸分子互补,该方法包括检测在肺癌细胞中具有特定表达模式的该多种分类器生物标记物的核酸分子的表达水平,其中该分类器生物标记物选自下组,该组由表1中列出的分类器生物标记物组成,该方法包括:(a)从来自患者的该肺组织样品中分离核酸材料;(b)将该核酸材料与该多种寡核苷酸混合,该多种寡核苷酸与该多种分类器生物标记物的核酸分子互补;并且(c)检测该多种分类器生物标记物的表达,其中所述多种分类器生物标记物由表1中的所有分类器生物标记物组成。
11.根据权利要求10所述的用途,其中该用途还包括将检测到的表1的该多种分类器生物标记物的表达水平与至少一个样品训练集中的表1的该至少一种分类器生物标记物的表达进行比较,其中该至少一个样品训练集包含来自参考基底型SQ样品的表1的该多种分类器生物标记物的表达数据、来自参考经典型SQ样品的表1的该多种分类器生物标记物的表达数据、来自参考分泌型SQ样品的表1的该多种分类器生物标记物的表达数据、来自参考原发型SQ样品的表1的该多种分类器生物标记物的表达数据或其组合;并且基于该比较步骤的结果将该样品分类为基底、经典、分泌或原发亚型。
12.根据权利要求11所述的用途,其中该比较步骤包括应用统计算法,该统计算法包括确定从该样品获得的表达水平数据与来自该至少一个训练集的表达水平数据之间的相关性;并且基于该统计算法的结果将该样品分类为基底、经典、分泌或原发亚型。
13.根据权利要求10-12中任一项所述的用途,其中对该表达水平的该检测包括进行qRT-PCR或任何基于杂交的基因测定。
14.根据权利要求13所述的用途,其中通过进行qRT-PCR检测该表达水平。
15.根据权利要求14所述的用途,其中对该表达水平的该检测包括使用对表1的多种分类器生物标记物中的每种有特异性的至少一对寡核苷酸引物。
16.根据权利要求10所述的用途,还包括基于检测到的该多种分类器生物标记物的表达水平预测对用于治疗肺鳞状细胞癌(SQ)亚型的疗法的反应。
17.根据权利要求16所述的用途,其中该疗法是化学疗法、血管生成抑制剂和/或免疫疗法。
18.根据权利要求17所述的用途,其中该肺SQ亚型是原发型,并且该疗法是免疫疗法。
19.根据权利要求10所述的用途,其中该样品是从该患者获得的***固定的石蜡包埋的(FFPE)肺组织样品、新鲜或冷冻的组织样品、外泌体、洗涤液体、细胞沉淀物或体液。
20.根据权利要求19所述的用途,其中该体液是血液或其部分、尿液、唾液或痰液。
CN201780044228.2A 2016-05-17 2017-05-17 对肺鳞状细胞癌亚型分型的方法 Active CN109863251B (zh)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201662337645P 2016-05-17 2016-05-17
US62/337,645 2016-05-17
US201662379402P 2016-08-25 2016-08-25
US62/379,402 2016-08-25
US201662396587P 2016-09-19 2016-09-19
US62/396,587 2016-09-19
US201662420836P 2016-11-11 2016-11-11
US62/420,836 2016-11-11
US201662425717P 2016-11-23 2016-11-23
US62/425,717 2016-11-23
PCT/US2017/033107 WO2017201164A1 (en) 2016-05-17 2017-05-17 Methods for subtyping of lung squamous cell carcinoma

Publications (2)

Publication Number Publication Date
CN109863251A CN109863251A (zh) 2019-06-07
CN109863251B true CN109863251B (zh) 2022-11-18

Family

ID=60325556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780044228.2A Active CN109863251B (zh) 2016-05-17 2017-05-17 对肺鳞状细胞癌亚型分型的方法

Country Status (6)

Country Link
US (2) US11041214B2 (zh)
EP (1) EP3458611B1 (zh)
JP (1) JP7241352B2 (zh)
CN (1) CN109863251B (zh)
CA (1) CA3024744A1 (zh)
WO (1) WO2017201164A1 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10829819B2 (en) 2014-05-30 2020-11-10 Genecentric Therapeutics, Inc. Methods for typing of lung cancer
EP3458612B1 (en) 2016-05-17 2023-11-15 Genecentric Therapeutics, Inc. Methods for subtyping of lung adenocarcinoma
US11041214B2 (en) 2016-05-17 2021-06-22 Genecentric Therapeutics, Inc. Methods for subtyping of lung squamous cell carcinoma
US20210388449A1 (en) 2018-10-09 2021-12-16 Genecentric Therapeutics, Inc. Detecting cancer cell of origin
DE102018125324A1 (de) * 2018-10-12 2020-04-16 Universität Rostock Verfahren zur Vorhersage einer Antwort auf die Therapie von Krankheiten
US20220403471A1 (en) * 2019-08-27 2022-12-22 Exact Sciences Corporation Characterizing methylated dna, rna, and proteins in subjects suspected of having lung neoplasia
CN111369501B (zh) * 2020-02-24 2022-04-01 武汉大学 一种基于视觉特征识别口腔鳞状细胞癌的深度学习方法
CN111653312B (zh) * 2020-05-28 2021-04-16 上海宝藤生物医药科技股份有限公司 一种利用基因组数据探究疾病亚型亲缘性的方法
CN111755073B (zh) * 2020-05-31 2022-11-15 复旦大学 基于转录组的pd-1疗法治疗效果预测***
CN112433054A (zh) * 2020-11-20 2021-03-02 四川大学华西医院 C9蛋白检测试剂在制备肺癌筛查试剂盒中的用途
WO2022226391A1 (en) * 2021-04-23 2022-10-27 The Trustees Of Columbia University In The City Of New York Methods for detecting squamous cancer
CN115982644B (zh) * 2023-01-19 2024-04-30 中国医学科学院肿瘤医院 一种食管鳞状细胞癌分类模型构建与数据处理方法

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4843155A (en) 1987-11-19 1989-06-27 Piotr Chomczynski Product and process for isolating RNA
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
EP0773227A1 (en) 1991-09-18 1997-05-14 Affymax Technologies N.V. Diverse collections of oligomers in use to prepare drugs, diagnostic reagents, pesticides or herbicides
US5384261A (en) 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
ATE262374T1 (de) 1991-11-22 2004-04-15 Affymetrix Inc Kombinatorische strategien für polymersynthese
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US5545531A (en) 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
US5856174A (en) 1995-06-29 1999-01-05 Affymetrix, Inc. Integrated nucleic acid diagnostic device
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
EP0880598A4 (en) 1996-01-23 2005-02-23 Affymetrix Inc RAPID EVALUATION OF NUCLEIC ACID ABUNDANCE DIFFERENCE, WITH A HIGH-DENSITY OLIGONUCLEOTIDE SYSTEM
DE69829402T2 (de) 1997-10-31 2006-04-13 Affymetrix, Inc. (a Delaware Corp.), Santa Clara Expressionsprofile in adulten und fötalen organen
US6020135A (en) 1998-03-27 2000-02-01 Affymetrix, Inc. P53-regulated genes
US6670321B1 (en) 1998-12-30 2003-12-30 The Children's Medical Center Corporation Prevention and treatment for retinal ischemia and edema
CA2432639A1 (en) 2000-11-16 2002-05-23 Cemines, Llc Profiling tumor specific markers for the diagnosis and treatment of neoplastic disease
US7473767B2 (en) 2001-07-03 2009-01-06 The Institute For Systems Biology Methods for detection and quantification of analytes in complex mixtures
WO2003029273A2 (en) 2001-09-28 2003-04-10 Whitehead Institute For Biomedical Research Classification of lung carcinomas using gene expression analysis
TW200413725A (en) 2002-09-30 2004-08-01 Oncotherapy Science Inc Method for diagnosing non-small cell lung cancers
US20060024692A1 (en) 2002-09-30 2006-02-02 Oncotherapy Science, Inc. Method for diagnosing non-small cell lung cancers
US8822153B2 (en) 2007-06-01 2014-09-02 The University Of North Carolina At Chapel Hill Molecular diagnosis and typing of lung cancer variants
WO2009046738A1 (en) * 2007-10-09 2009-04-16 Curevac Gmbh Composition for treating lung cancer, particularly of non-small lung cancers (nsclc)
CN101509035A (zh) 2008-09-05 2009-08-19 中国人民解放军总医院 肺癌分型的基因序列及其应用
US9846162B2 (en) 2012-05-14 2017-12-19 Yale University Immune biomarkers and assays predictive of clinical response to immunotherapy for cancer
CA2876951A1 (en) * 2012-06-18 2013-12-27 The University Of North Carolina At Chapel Hill Methods for head and neck cancer prognosis
EP2806274A1 (en) * 2013-05-24 2014-11-26 AIT Austrian Institute of Technology GmbH Lung cancer diagnostic method and means
AU2015260962B2 (en) * 2014-05-13 2020-06-11 Medimmune Limited Anti-B7-H1 and anti-CTLA-4 antibodies for treating non-small cell lung cancer
US10829819B2 (en) 2014-05-30 2020-11-10 Genecentric Therapeutics, Inc. Methods for typing of lung cancer
ES2952717T3 (es) * 2014-10-14 2023-11-03 Novartis Ag Moléculas de anticuerpos contra PD-L1 y usos de las mismas
CA2982775A1 (en) 2015-04-14 2016-10-20 Genecentric Therapeutics, Inc. Methods for typing of lung cancer
US11041214B2 (en) 2016-05-17 2021-06-22 Genecentric Therapeutics, Inc. Methods for subtyping of lung squamous cell carcinoma
EP3458612B1 (en) 2016-05-17 2023-11-15 Genecentric Therapeutics, Inc. Methods for subtyping of lung adenocarcinoma

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A comparison of PAM50 intrinsic subtyping with immunohistochemistry and clinical prognostic factors in tamoxifen-treated estrogen receptor-positive breast cancer;Neilson TO等;《Clin Cancer Res》;20101231;第16卷(第21期);5222-5232 *
Lung Squamous Cell Carcinoma mRNA Expression Subtypes Are Reproducible, Clinically Important, and Correspond to Normal Cell Types;Wilkerson MD等;《Clin Cancer Res》;20101001;第16卷(第19期);4864-4875 *
Spatiotemporal dynamics of intratumoral immune cells reveal the immune landscape in human cancer;Bindea g等;《Immunity》;20131017;第39卷(第41期);782-795 *

Also Published As

Publication number Publication date
EP3458611A4 (en) 2020-02-26
WO2017201164A1 (en) 2017-11-23
US20210340631A1 (en) 2021-11-04
EP3458611B1 (en) 2023-11-08
JP2019516406A (ja) 2019-06-20
CN109863251A (zh) 2019-06-07
JP7241352B2 (ja) 2023-03-17
CA3024744A1 (en) 2017-11-23
US20190338366A1 (en) 2019-11-07
EP3458611A1 (en) 2019-03-27
US11041214B2 (en) 2021-06-22

Similar Documents

Publication Publication Date Title
CN109863251B (zh) 对肺鳞状细胞癌亚型分型的方法
CN109790583B (zh) 对肺腺癌亚型分型的方法
RU2719194C2 (ru) Оценка активности клеточных сигнальных путей с применением вероятностного моделирования экспрессии целевых генов
RU2721130C2 (ru) Оценка активности путей клеточной сигнализации с помощью линейной комбинации(ий) экспрессий генов-мишеней
AU2017267184B2 (en) Method for assessing a prognosis and predicting the response of patients with malignant diseases to immunotherapy
KR102023584B1 (ko) 위장관췌장 신경내분비 신생물 (GEP-NENs)의 예측 방법
AU2013277971B2 (en) Molecular malignancy in melanocytic lesions
AU2012345789B2 (en) Methods of treating breast cancer with taxane therapy
US20230416827A1 (en) Assay for distinguishing between sepsis and systemic inflammatory response syndrome
US11674188B2 (en) Biomarkers and combinations thereof for diagnosing tuberculosis
CN101573453A (zh) 使用生物学途径基因表达分析来预测***阴性原发性乳腺癌的远处转移的方法
KR101421326B1 (ko) 유방암 예후 예측을 위한 조성물 및 이를 포함하는 키트
WO2003042661A2 (en) Methods of diagnosis of cancer, compositions and methods of screening for modulators of cancer
KR100964193B1 (ko) 간암 예후 마커
CN101258249A (zh) 检测黑素瘤的方法和试剂
CA2430981A1 (en) Gene expression profiling of primary breast carcinomas using arrays of candidate genes
AU2018210695A1 (en) Molecular subtyping, prognosis, and treatment of bladder cancer
AU2016331663A1 (en) Pathogen biomarkers and uses therefor
KR20140140069A (ko) 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법
MXPA05005653A (es) Determinacion y seleccion terapeutica de genes de insuficiencia cardiaca.
KR20060045950A (ko) 혈액학적 악성종양에 대한 예후
KR20220054401A (ko) 감염의 숙주 rna 바이오마커의 신속한 조기-검출 및 인간의 covid-19 코로나바이러스 감염의 조기 식별을 위한 시스템, 방법 및 조성물
KR20070099564A (ko) 급성 골수성 백혈병 환자를 평가하는 방법
CA2666057C (en) Genetic variations associated with tumors
CN114127314A (zh) 用于对乳腺癌的亚型(Subtype)进行鉴别或者分类的鉴别标志物遗传基因组、方法和套件

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant