CN110042124A - 基因组碱基编辑增加人红细胞中胎儿血红蛋白水平的试剂盒及应用 - Google Patents

基因组碱基编辑增加人红细胞中胎儿血红蛋白水平的试剂盒及应用 Download PDF

Info

Publication number
CN110042124A
CN110042124A CN201910338688.7A CN201910338688A CN110042124A CN 110042124 A CN110042124 A CN 110042124A CN 201910338688 A CN201910338688 A CN 201910338688A CN 110042124 A CN110042124 A CN 110042124A
Authority
CN
China
Prior art keywords
seq
kit
sgrna
base
gamma globulin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910338688.7A
Other languages
English (en)
Inventor
马旭
江雯
金孝华
李广磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute Of Science And Technology National Health Commission
Original Assignee
Institute Of Science And Technology National Health Commission
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute Of Science And Technology National Health Commission filed Critical Institute Of Science And Technology National Health Commission
Priority to CN201910338688.7A priority Critical patent/CN110042124A/zh
Publication of CN110042124A publication Critical patent/CN110042124A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/28Bone marrow; Haematopoietic stem cells; Mesenchymal stem cells of any origin, e.g. adipose-derived stem cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/06Antianaemics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Hematology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Diabetes (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Virology (AREA)
  • Biochemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种基因组碱基编辑增加人红细胞中胎儿血红蛋白水平的试剂盒及应用。该试剂盒包括碱基编辑***以及针对γ‑球蛋白基因启动子位点的sgRNA。本发明利用碱基编辑技术,通过C到T和/或A到G碱基突变,改变γ‑球蛋白基因启动子区域的转录因子结合位点,从而提高γ‑球蛋白的表达水平,为治疗该类血红蛋白病提供了高效安全的方法及试剂盒。

Description

基因组碱基编辑增加人红细胞中胎儿血红蛋白水平的试剂盒 及应用
技术领域
本发明涉及一种通过基因组碱基编辑增加人红细胞中胎儿血红蛋白(HbF)水平的试剂盒和方法。
背景技术
血红蛋白病包括遗传性的血红蛋白结构或表达变化引起的多种贫血,包括血红蛋白链分子结构的改变(如镰状细胞性贫血),以及其中一个或多个链的合成减少或缺乏(如地中海贫血)。与β-球蛋白相关的疾病通常被称为β-血红蛋白病。例如,β-地中海贫血是由于β-球蛋白基因表达的部分或完全缺陷导致血红蛋白A(HbA)缺乏或不存在;镰状细胞病(SCD)是由β-球蛋白结构基因(HBB)中的突变引起。目前对大多数患者的治疗仍然是支持性的,旨在缓解症状和治疗并发症。唯一的治愈方法是异体造血干细胞移植,但由于供体的匮乏和高风险的严重并发症,目前,显著改变疾病的自然病程的明确疗法(如定期输血或交换输血和HSC移植)是有限的。
因此,研究者们一直试图通过基因修复的方式进行治疗。特别是新的基因编辑技术CRISPR/Cas9技术的应用,使得国内外尝试利用CRISPRCas9基因编辑技术治疗β地中海贫血越来越受关注。2014年加州大学旧金山分校的Yuet Wai Kan教授及其同事利用CRISPR/Cas9与iPS技术实现在人类细胞系中修复引起β-地中海贫血的突变基因(Xie et al.,2014),2016年他们又应用该技术尝试了在人源造血干祖细胞(HSPC)中敲除了一段含δ、β珠蛋白基因的13kb的片段,使γ珠蛋白的表达上调(Ye et al.,2016)。2016年,广州医科大学附属第三医院孙筱放团队通过CRISPR/Cas9基因编辑技术,成功纠正β-地贫iPSCs细胞中的β珠蛋白基因突变(Niu et al.,2016)。
虽然上述方法均取得了显著的突破,然而这些策略如果用于临床,存在一定的局限性:①β地贫的患者其β珠蛋白基因突变位点各不相同,目前发现的约有上百种突变形式,用上述方法进行治疗必须对每一个病人设计不同的基因编辑位点,造成治疗成本高,程序复杂;②iPSCs具有一定的癌变可能,用于临床尚存在风险;③将iPSCs诱导成HSPC的技术还不成熟;④用CRISPR/Cas9基因编辑技术会产生DNA双链断裂,诱导细胞凋亡,以及产生安全性隐患,例如大片段的缺失(Adikusuma et al.,2018)等。因此,寻找一种更加有效的、具有普适性的、癌变风险较低的创新治疗方法,是治疗血红蛋白病的关键问题。
为了提高碱基突变的效率,以及避免产生DNA双链断裂引起的安全性问题,一种通过将胞嘧啶脱氨酶融合在dCas9蛋白上,在不引起双链断裂的情况下高效的获得碱基定点突变的工具被研发出来。这种新型工具被称为碱基编辑工具(Chadwick et al.,2017;Hesset al.,2016;Kim et al.,2017;Komor et al.,2016;Nishida et al.,2016)。尽管碱基编辑技术近年才出现,但已经被广泛用于许多领域。比如利用BE3***以碱基编辑方式成功修复了与乳腺癌相关基因TP53上的一个碱基突变,以及与阿兹海默症相关基因APOE4上的一个碱基突变(Komor et al.,2016)。利用碱基编辑方法能避免在高拷贝位点产生过多DNA双链断裂(DSB)进而引起细胞死亡(Billon et al.,2017;Kuscu et al.,2017),也能增加编辑的效率和准确性。因此,这种基于CRISPR-Cas9***产生的碱基编辑工具在临床应用上更安全更有效,具有更大的优势。Keith Joung实验室用碱基编辑工具A3A-BE3更精确的校正人β-地中海贫血启动子突变(Gehrke et al.,2018)。
一般来说,人类β珠蛋白基因包含4个按其排列顺序依次表达的β类珠蛋白功能基因,分别为ε、γ、δ、β。其中ε珠蛋白主要表达于胚胎期,γ珠蛋白主要表达于胎儿期,β珠蛋白主要表达于成人期。胎儿期时,γ珠蛋白与α珠蛋白相结合形成胎儿血红蛋白(HbF),成人期时β珠蛋白与α珠蛋白相结合形成成人血红蛋白(HbA)。人类在出生后经历一个从胎儿到成人的珠蛋白开关转换机制,即完成一个由γ→β珠蛋白的表达转换,因此正常成人中γ-珠蛋白基因呈现相对沉默状态。研究表明,如果重新激活成人中γ珠蛋白基因的表达,使其与过剩的α珠蛋白相结合形成HbF,可以有效地减轻因β珠蛋白合成减少或功能障碍所致的β-地中海贫血的临床症状(Bank,2006)。说明该方法不仅可以消除过剩的α珠蛋白累积造成的不利影响,同时HbF可以起到替代HbA行驶功能的作用。2018年,Nature genetics上发表的研究报道了两个抑制γ-珠蛋白表达的因子BCL11A和ZBTB7A在γ-珠蛋白启动子的结合区域分别为-115区域和-200区域(Martyn et al.,2018)。由于BE3作用的范围只有5nt,2018年,Jiang等报道了一种扩大作用范围到14nt的碱基编辑工具BE-PLUS,能更有效的通过碱基编辑的方式改变功能结构域的序列,从而达到改变和调节基因功能的作用(Jianget al.,2018)。
本发明利用碱基编辑工具(BE3、xBE3、ABE、BE-PLUS或BE-PLUS(AID))结合相应位置的sgRNA,破坏造血干细胞(HSC)BCL11A、ZBTB7A以及其他抑制因子在γ-珠蛋白启动子的结合区域(-114bp,-117bp,-158bp,-175bp,-196bp,-198/199bp(以转录起始位点TSS为O点,5’端为负,3’端为正)),在不产生DNA双链断裂的情况下,将该位点中C碱基突变为T碱基或A碱基突变为G碱基,以提高人红细胞中γ-珠蛋白的表达,为临床上治疗血红蛋白病提供可靠的试剂和方法。
参考文献
Adikusuma,F.,Piltz,S.,Corbett,M.A.,Turvey,M.,McColl,S.R.,Helbig,K.J.,Beard,M.R.,Hughes,J.,Pomerantz,R.T.,and Thomas,P.Q.(2018).Large deletionsinduced by Cas9cleavage.Nature 560,E8-E9.
Billon,P.,Bryant,E.E.,Joseph,S.A.,Nambiar,T.S.,Hayward,S.B.,Rothstein,R.,and Ciccia,A.(2017).CRISPR-Mediated Base Editing EnablesEfficient Disruption of Eukaryotic Genes through Induction of STOPCodons.Molecular cell 67,1068-1079e1064.
Chadwick,A.C.,Wang,X.,and Musunuru,K.(2017).In Vivo Base Editing ofPCSK9(Proprotein Convertase Subtilisin/Kexin Type 9)as a TherapeuticAlternative to Genome Editing.Arteriosclerosis,thrombosis,and vascularbiology 37,1741-1747.
Gehrke,J.M.,Cervantes,O.,Clement,M.K.,Wu,Y.,Zeng,J.,Bauer,D.E.,Pinello,L.,and Joung,J.K.(2018).An APOBEC3A-Cas9base editor with minimizedbystander and off-target activities.Nature biotechnology.
Hess,G.T.,Fresard,L.,Han,K.,Lee,C.H.,Li,A.,Cimprich,K.A.,Montgomery,S.B.,and Bassik,M.C.(2016).Directed evolution using dCas9-targeted somatichypermutation in mammalian cells.Nature methods 13,1036-1042.
Jiang,W.,Feng,S.,Huang,S.,Yu,W.,Li,G.,Yang,G.,Liu,Y.,Zhang,Y.,Zhang,L.,Hou,Y.,et al.(2018).BE-PLUS:a new base editing tool with broadened editingwindow and enhanced fidelity.Cell research.
Kim,D.,Lim,K.,Kim,S.T.,Yoon,S.H.,Kim,K.,Ryu,S.M.,and Kim,J.S.(2017).Genome-wide target specificities of CRISPR RNA-guided programmabledeaminases.Nat Biotechnol 35,475-480.
Komor,A.C.,Kim,Y.B.,Packer,M.S.,Zuris,J.A.,and Liu,D.R.(2016).Programmable editing of a target base in genomic DNA without double-strandedDNA cleavage.Nature 533,420-424.
Kuscu,C.,Parlak,M.,Tufan,T.,Yang,J.,Szlachta,K.,Wei,X.,Mammadov,R.,and Adli,M.(2017).CRISPR-STOP:gene silencing through base-editing-inducednonsense mutations.Nature methods 14,710-712.
Martyn,G.E.,Wienert,B.,Yang,L.,Shah,M.,Norton,L.J.,Burdach,J.,Kurita,R.,Nakamura,Y.,Pearson,R.C.M.,Funnell,A.P.W.,et al.(2018).Natural regulatorymutations elevate the fetal globin gene via disruption of BCL11A or ZBTB7Abinding.Nature genetics 50,498-503.
Nishida,K.,Arazoe,T.,Yachie,N.,Banno,S.,Kakimoto,M.,Tabata,M.,Mochizuki,M.,Miyabe,A.,Araki,M.,Hara,K.Y.,et al.(2016).Targeted nucleotideediting using hybrid prokaryotic and vertebrate adaptive immunesystems.Science 353.
Niu,X.,He,W.,Song,B.,Ou,Z.,Fan,D.,Chen,Y.,Fan,Y.,and Sun,X.(2016).Combining Single Strand Oligodeoxynucleotides and CRISPR/Cas9to Correct GeneMutations in beta-Thalassemia-induced Pluripotent Stem Cells.The Journal ofbiological chemistry 291,16576-16585.
Xie,F.,Ye,L.,Chang,J.C.,Beyer,A.I.,Wang,J.,Muench,M.O.,and Kan,Y.W.(2014).Seamless gene correction of beta-thalassemia mutations in patient-specific iPSCs using CRISPR/Cas9and piggyBac.Genome research 24,1526-1533.
Ye,L.,Wang,J.,Tan,Y.,Beyer,A.I.,Xie,F.,Muench,M.O.,and Kan,Y.W.(2016).Genome editing using CRISPR-Cas9to create the HPFH genotype in HSPCs:An approach for treating sickle cell disease and beta-thalassemia.Proceedingsof the National Academy of Sciences of the United States of America 113,10661-10665.
发明内容
本发明的目的是提供一种通过基因组碱基编辑增加人红细胞中胎儿血红蛋白(HbF;其两条多肽链从γ-球蛋白基因表达)水平的方法,其可用于治疗血红蛋白病诸如β-地中海贫血和镰状细胞病。并且提供了用于进行此种方法的组分、试剂盒和组合物、以及由它们产生的细胞,包括但不限于可施用于患有血红蛋白病的患者的自体CD34+人造血干细胞(hHSC)。
为了达到上述目的,本发明采用了一种高效提高人红细胞中血红蛋白的碱基编辑的试剂盒,其特征在于,包括碱基编辑***以及针对γ-球蛋白基因启动子位点的sgRNA。
优选地,所述的碱基编辑***为BE3、xBE3、ABE、BE-PLUS或BE-PLUS(AID)。
优选地,所述的碱基编辑***可以是质粒,mRNA或蛋白形式,优先选择蛋白形式。
优选地,所述的针对γ-球蛋白基因启动子位点的sgRNA,若位于-114bp,其对应的sgRNA为SEQ ID NO.1,若位于-117bp,其对应的sgRNA为SEQ ID NO.2,若位于-158bp,其对应的sgRNA为SEQ ID NO.3,若位于-175bp,其对应的sgRNA为SEQ ID NO.4,若位于-196bp,其对应的sgRNA为SEQ ID NO.5,若位于-198/199bp,其对应的sgRNA为SEQ ID NO.6,.
优选地,所使用的sgRNA可以是质粒形式,也可以是RNA形式,优先选择RNA形式。
本发明提供了一种通过多个碱基突变破环蛋白结合位点,从而改变基因表达水平的方法,其特征在于,包括根据γ-球蛋白基因启动子不同区域设计sgRNA和碱基编辑***中的至少一种。
本发明提供了一种碱基编辑治疗血红蛋白病的方法,包括:在含有β-球蛋白基因突变的病人的HSC中,利用针对γ-球蛋白基因启动子区域的sgRNA引导碱基编辑***到该位点进行碱基编辑修复,收集转染后的细胞,鉴定突变率,HSC分化后鉴定γ-球蛋白的表达变化。
优选地,所述的根据γ-球蛋白基因启动子区域设计的sgRNA,通过构建U6启动和/或T7启动的表达载体得到。
优选地,所述的碱基编辑治疗血红蛋白病的方法还包括:Sanger测序检测编辑效率;高通量测序on-target,indel和off-target的效率。
β-球蛋白的减少或缺失是造成β-血红蛋白病的主要原因,但其突变类型上百种,修复突变非常的费时费力,且不容易达到,然而提高γ-球蛋白的表达却是一种治疗该类疾病的通用方法,碱基编辑***提供了一种安全有效的通用治疗方法。
发明人将利用基于碱基编辑工具结合合适的sgRNA,造成γ-球蛋白基因启动子区域的碱基突变,从而破坏抑制γ-球蛋白表达的调控因子(BCL11A、ZBTB7A以及其他抑制因子)的结合位点,提高γ-球蛋白基因的表达,利用深度测序的方式检测修复效率和脱靶情况。为治疗该类疾病提供了高效安全的方法。
附图说明
图1为BE3、xBE3、ABE、BE-PLUS或BE-PLUS(AID)5种碱基编辑工具的构成示意图。
图2为分别用114/117/158/175/196/198/199sgRNA与相应的碱基编辑工具对基因组DNA进行编辑后PCR片段的测序结果。箭头所示为对应的位置。
图3为流式分选后得到的CD34+造血干细胞的比例为88.6%。
图4为流式分选后的CD34+造血干细胞培养7天内的增值曲线。
图5为培养4天时,CD34+造血干细胞的比例为98.6%。
图6为CD34+造血干细胞向红系分化0-21天中红系标识CD235和CD71表达的增高。
图7为红系分化后的细胞沉淀呈现红色,而未分化的对照细胞呈现白色。
图8为qPCR检测用不同sgRNA进行碱基编辑后,HBG表达的变化。
具体实施方式
下面将结合实施例对本发明的实施方案进行详尽的描述和说明,显然,所描述的实施例仅用于说明本发明的一部分实施例,而不应视为限制本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,视为可以通过市售购买获得的常规产品。
首先纯化不同类型的蛋白,所用的原始载体序列为BE3(SEQ ID NO.7)、xBE3(SEQID NO.8)、ABE(SEQ ID NO.9)、BE-PLUS(GCN4-D10A(SEQ ID NO.10)和scFv-APOBEC(SEQ IDNO.11))或BE-PLUS(AID)(GCN4-D10A(SEQ ID NO.10)和scFv-AID(SEQ ID NO.12))。
1.将上述四种质粒的编码区分别构建到载体pET28a(优宝生物,VT1207)中。
2.摇菌,8L LB,Kana,大约摇菌4小时(OD=0.8)后,加入IPTG 1mM,16℃摇菌48h。
3.沉菌,离心5000g,20min。
4.重悬,将所有沉菌用bufferA重悬,菌必须完全打散,防止后面破碎的时候堵塞仪器。
5.破碎,将菌液过仪器破碎,直到溶液清亮,一般至少破碎两次。仪器准备,需要清洗3-4遍,高压力部分金属管需要冰浴,仪器使用完毕后需要清洗3-4次。
6.收取10μL全细胞裂解产物,后续western检测。
7.将裂解产物置于50ml离心管中,80000g,40min。
8.收集上清,重复7,直到颗粒杂质去除干净。
9.0.45um滤器过滤上清,取10μL用于后续western检测,准备开始固相金属亲和层析(Immobilized Metal Affinity Chromatography(IMAC)(钴柱)。
10.钴柱用ddH2O洗一遍后,用bufferA润洗几遍。
11.将蛋白样品过钴柱(此次用两个柱子),并收集流出液。
12.重复步骤11,并取10μL样品用于后续western。
13.去杂质,用40mL添加有5mM咪唑的bufferA过柱子,以去除亲和力较低的杂质。收集流出液,并取10μL样品用于后续western。
14.洗脱,用30ml添加有500mM咪唑的bufferA过柱子,置换出目的蛋白。收集目的蛋白,并取10μL样品用于后续western。洗脱后的钴柱用ddH2O清洗,以除去咪唑,之后再用bufferA平衡。
15.western,目的蛋白约160KD,根据蛋白大小配置合适的SDS-PAGE胶,210V电泳。
电泳结束后,将胶割下,置于考马斯亮蓝中,微波炉高温加热1min。之后,用ddH2O清洗,微波炉加热20min。用水冲洗后,拍照。
16.蛋白浓缩:将洗脱下来的目的蛋白加入到蛋白浓缩柱中,3900rpm,20min。
17.浓缩后的蛋白进行离子交换层析(Ion exchange chromatography(IEC)),以除去与蛋白结合的核酸。离子交换层析的原理即高盐溶液下,这种离子键就会被破坏,从而释放出目的蛋白。
18.层析收集的目的蛋白,经浓缩后进行酶切,以除去His-tag。
实施例1
本实施例中,在细胞株上利用碱基编辑工具结合sgRNA,本方法将利用碱基编辑工具(BE3、xBE3、ABE、BE-PLUS或BE-PLUS(AID))和sgRNA的质粒形式实现(图1)。
1.1质粒构建
在γ-珠蛋白(HBG)基因启动子-114bp,-117bp,-158bp,-175bp,-196bp,-198/199bp(以转录起始位点TSS为O点,5’端为负,3’端为正)位置处设计sgRNA(SEQ ID NO.1,SEQ ID NO.2,SEQ ID NO.3)合成oligos。
114sgRNA:
上游序列为:5’-ACCGcttgaccaatagccttgaca-3’(SEQ ID NO.(13))
下游序列为:5’-AAACtgtcaaggctattggtcaag-3’(SEQ ID NO.(14))
117sgRNA:
上游序列为:5’-ACCGgctattggtcaaggcaaggc-3’(SEQ ID NO.(15))
下游序列为:5’-AAACgccttgccttgaccaatagc-3’(SEQ ID NO.(16))
158sgRNA:
上游序列为:5’-ACCGccctggctaaactccaccca-3’(SEQ ID NO.(17))
下游序列为:5’-AAACtgggtggagtttagccaggg-3’(SEQ ID NO.(18))
175sgRNA(ABE):
上游序列为:5’-ACCGatatttgcattgagatagtg-3’(SEQ ID NO.(19))
下游序列为:5’-AAACcactatctcaatgcaaatat-3’(SEQ ID NO.(20))
196sgRNA(xBE3):
上游序列为:5’-ACCGccttccccacactatctcaa-3’(SEQ ID NO.(21))
下游序列为:5’-AAACttgagatagtgtggggaagg-3’(SEQ ID NO.(22))
198/199sgRNA(ABE):
上游序列为:5’-ACCGgtggggaaggggcccccaag-3’(SEQ ID NO.(23))
下游序列为:5’-AAACcttgggggccccttccccac-3’(SEQ ID NO.(24))
Oligo退火
Fast anneal体系:
Fast anneal条件:
95° 5min
95° 30s
85° 30s(-2°/s,降至25°)
25° 1min(0.1°/s)
4° ∞
上下游序列通过退火,连接到经过BsaI(NEB:R0539L)线性化的pGL3-U6sgRNA载体上(addgene:51133)上。
酶切体系:
pGL3-U6sgRNA:3μg
Cutsmart(NEB#B7204S):5μL
BsaI(NEB#R0535L) 1μL
ddH2O to 50μL
条件:37℃,过夜。
连接体系:
条件:16°连接30min
连接的载体通过转化,挑菌,鉴定,鉴定引物上游序列:5’-cgattagtgaacggatctcgacg-3’(SEQ ID NO.25),下游序列为相应oligo的下游序列。对阳性克隆摇菌提取质粒(Axygene:AP-MN-P-250G)测定浓度备用。获得的突变质粒命名为HBG-U6-114/117/158/175/196/198/199sgRNA。
1.2细胞的培养与电转
(1)以HEK293T细胞(购自ATCC)为例,本发明进行真核生物细胞的培养与转染:HEK293T细胞接种培养于添加10%FBS的DMEM高糖培养液中(HyClone,SH30022.01B),其中含penicillin(100U/ml)和streptomycin(100μg/ml)。
(2)转染前两个小时换成无抗生素的培养基,利用lipofectamin 2000转染试剂(invitrogen 11668-019)按照说明书转染,细胞通过计数得1X105个。将碱基编辑***BE3、xBE3、ABE、BE-PLUS或BE-PLUS(AID)与sgRNA按照1μg和0.3μg的质量混合(其中BE-PLUS/BE-PLUS(AID)所含两个质粒的比例为GCN4-D10A:scFv-APOBEC/scFv-AID=0.4:0.6)。转染后8h换含双抗的新鲜培养基,并在转染后24h加入puromicin至终浓度2ng/ml,药物筛选2d。
(3)药筛2d后,裂解细胞鉴定基因型,裂解液的成分为50mM KCl,1.5mM MgCl2,10mM Tris pH 8.0,0.5%Nonidet P-40,0.5%Tween 20,100g/ml protease K。
1.3突变效率的检测
鉴于114sgRNA、117sgRNA、158sgRNA中的突变目的位点为C突变为T,且其PAM序列是NGG,优选使用BE3、BE-PLUS和BE-PLUS(AID);而175sgRNA、198/199sgRNA中的突变目的位点为A突变为G,优选使用ABE;196sgRNA的PAM序列是NG,优选使用xBE3(图2)。
实施例2
本实施例中,在正常人分离得到的造血干细胞(HSC)中,利用碱基编辑***的mRNA与sgRNA的RNA形式实现碱基编辑,检测HBG表达变化。
2.1sgRNA质粒构建
在γ-珠蛋白(HBG)基因启动子-114bp,-117bp,-158bp,-175bp,-196bp,-198/199bp(以转录起始位点TSS为O点,5’端为负,3’端为正)位置处设计sgRNA合成oligos。
114sgRNA:
上游序列为:5’-TAGGcttgaccaatagccttgaca-3’(SEQ ID NO.(26))
下游序列为:5’-AAACtgtcaaggctattggtcaag-3’(SEQ ID NO.(27))
117sgRNA:
上游序列为:5’-TAGGgctattggtcaaggcaaggc-3’(SEQ ID NO.(28))
下游序列为:5’-AAACgccttgccttgaccaatagc-3’(SEQ ID NO.(29))
158sgRNA:
上游序列为:5’-TAGGccctggctaaactccaccca-3’(SEQ ID NO.(30))
下游序列为:5’-AAACtgggtggagtttagccaggg-3’(SEQ ID NO.(31))
175sgRNA(ABE):
上游序列为:5’-TAGGatatttgcattgagatagtg-3’(SEQ ID NO.(32))
下游序列为:5’-AAACcactatctcaatgcaaatat-3’(SEQ ID NO.(33))
196sgRNA(xBE3):
上游序列为:5’-TAGGccttccccacactatctcaa-3’(SEQ ID NO.(34))
下游序列为:5’-AAACttgagatagtgtggggaagg-3’(SEQ ID NO.(35))
198/199sgRNA(ABE):
上游序列为:5’-TAGGgtggggaaggggcccccaag-3’(SEQ ID NO.(36))
下游序列为:5’-AAACcttgggggccccttccccac-3’(SEQ ID NO.(37))
Oligo退火
Fast anneal体系:
Fast anneal条件:
95° 5min
95° 30s
85° 30s(-2°/s,降至25°)
25° 1min(0.1°/s)
4° ∞
上下游序列通过退火,连接到经过BsaI(NEB:R0539L)线性化的pUC57-T7sgRNA载体上(addgene:51132)上。
酶切体系:
pUC57-T7sgRNA:3μg
Cutsmart(NEB#B7204S):5μL
BsaI(NEB#R0535L) 1μL
ddH2O to 50μL
条件:37℃,过夜。
连接体系:
条件:16°连接30min
连接的载体通过转化,挑菌,鉴定,鉴定引物上游序列:5’-cgattagtgaacggatctcgacg-3’(SEQ ID NO.25),下游序列为相应oligo的下游序列。对阳性克隆摇菌提取质粒(Axygene:AP-MN-P-250G)测定浓度备用。获得的突变质粒命名为HBG-T7-114/117/158/175/196/198/199sgRNA。
2.2sgRNA的体外转录
以构建的HBG-T7-114/117/158/175/196/198/199sgRNA为模板,扩增含有sgRNA的片段,所用引物为:
FOR:5’-TCTCGCGCGTTTCGGTGATGACGG-3’(SEQ ID NO.38)
REV:5’-AAAAAAAGCACCGACTCGGTGCCACTTTTTC-3’(SEQ ID NO.39)
扩增体系如下:
2Xbuffer(诺唯赞:P505) 25μL
dNTP 1μL;F(10pmol/μL) 2μL
R(10pmol/μL) 2μL
模板 1ng
DNA聚合酶(诺唯赞:P505) 0.5μL;
ddH2O补齐到50μL。
PCR产物纯化:
①每100μL体积加4μL RNAsecure(Life:AM7005),60℃,15分钟;
②加入三倍体积的PCR-A(Axygen:AP-PCR-250G)过柱,12000转/分钟,离心1分钟;
③弃废液,加入500μL W2,12000转/分钟,离心1分钟;
④弃废液,12000转/分钟,空转1分钟;
⑤换收集管,加入20μL无RNAase水洗脱,12000转/分钟,1分钟。
转录步骤如下:
利用体外转录试剂盒(Ambion,Life Technologies,AM1354)
反应体系为:
反应条件:37℃,5h。加入1μL DNase,37℃,15分钟。
回收sgRNA步骤:
利用回收试剂盒(Ambion,Life Technologies,AM1908)
①上步反应体积加入90μL Elution solution移至1.5mlEP管;
②加入350μL Binding solution混匀;
③加入250μL无水乙醇混匀;上柱;10000转/分钟,离心30秒,倒掉废液;
④加入500μL Washing solution,10000转/分钟,离心30秒,倒掉废液;
⑤10000转/分钟,空转1分钟;
⑥换收集管,加入100μL Elution solution洗脱;
⑦在洗脱得到的液体中加入10μL醋酸铵(Ambion,Life Technologies,AM1908)混匀;
⑧加入275μL无水乙醇混匀;
⑨-20℃放置30分钟,同时准备70%乙醇放置-20℃;
⑩4℃环境下13000转/分钟离心15分钟。
弃上清,加入500μL 70%乙醇;
10000转/分钟,离心5分钟,吸尽废液,晾干5分钟;
加入20μL的Rnase-free水溶解;取1μL测浓度。
2.3碱基编辑***的体外转录
将碱基编辑***编码区酶切回收(本步骤是将质粒进行线性化)。
体系如下:
条件:37℃,过夜。
线性化质粒的回收:
①酶切产物中加入4μL RNAsecure(Life:AM7005),60℃反应10分钟;
②利用回收试剂盒(QIAGEN:28004)进行操作其余步骤,加入5倍体积buffer PB,过柱;
③加入750μL buffer PE离心;空转1分钟;
④用10μL水洗脱,测定浓度。
体外转录:按照试剂盒(Invitrogen:AM1345)的要求依次加入体系:
线性化载体1ug;
2XNTP/ARCA 10μL;
T7ezyme mix2μL;
10xreaction buffer 2μL;
水补齐到20μL。
条件:37℃,2小时。然后加入1μL DNasea反应15分钟。
加尾:转录产物进行加尾处理保证转录mRNA的稳定性。
体系如下:
条件:37℃,30分钟。
回收:利用回收试剂盒进行(QIAGEN:74104)。
步骤如下:
①往上步反应产物中加入350μL buffer RLT;
②加入250μL无水乙醇,过柱,离心;
③加入500μL RPE,离心;
④空转;
⑤加入30μL水洗脱。测定浓度后-80℃保存。
2.4人HSC的分离培养与电转
用淋巴细胞分离液分离单个核细胞步骤如下:
①准备4ml骨髓样本,以1:1比例加入PBS进行稀释;
②加入等体积淋巴细胞分离液(GE 17-1440-03)(注意:加入时使ficoll在下,沿管壁缓缓将样本加入,不要破坏ficoll与血液的分层);
③1700转/分钟,离心30分钟;
④缓慢小心地吸取中间白色的一层,即单核细胞层,1500转/分钟,离心5分钟;
⑤倒齐上层液体,加入3ml红细胞裂解液,静置10分钟,1500转/分钟,离心5分钟,倒弃上层液体;
用人CD34+分选试剂盒(STEMCELL 18056)从骨髓样本中分离得到CD34+造血干细胞,步骤如下:
①使用圆底的14mL聚苯乙烯管(e.g.Corning Catalog#352057),将收集到的单核细胞用EasySepTM Buffer(Catalog#20144)重悬至0.25mL;
②加入25ul的抗体,吹打均匀,室温孵育15min;
③将磁柱上下颠倒混匀后,试管中加入12.5ul磁柱,吹打均匀后室温孵育10min;
④使用buffer将总体积重悬至5mL,轻轻吹打混匀;
⑤去掉试管盖,将试管放入磁极中,室温孵育5min;
⑥不要将试管拿出磁极,一起拿起磁极与试管,将试管中的液体倒至废液管中;
⑦重复步骤4-6三到四次;
⑧用buffer将试管壁上的细胞洗下来,确保将试管壁上的细胞收集完全;转移至离心管中,1000rpm,离心5min;
⑨弃去上清,使用培养基将细胞重悬至1*105/ml,于48孔板内培养。
分选得到的细胞用流式检测CD34+细胞,步骤如下:
Buffer:含有2%FBS的PBS;抗体:CD34-FITC(eBiosicience 11034941)
①收集5*105个细胞,重悬至100ul体积;
②加入5ul抗体,轻轻混匀,避光、冰上孵育30min;
③1000rpm,离心5min,弃去上清,加入1ml buffer,轻轻吹打均匀,1000rpm,离心5min,弃去上清;
④用buffer将细胞重悬至300ul,上机,流式检测,阳性率约80~90%(图3)。
分离得到的CD34+造血干细胞以6×104/ml的浓度培养在StemSpan SFEM培养基中,培养基中添加细胞因子100ul/ml:StemSpanTM CD34+Expansion Supplement(10X)(STEMCELL 02691)。细胞培养在37℃温箱,5%CO2条件,预刺激24小时。将相应的碱基编辑***mRNA与相应的sgRNA在37℃孵育10分钟,利用LONZA Nucleofector 2b进行电转,程序选择U-008。电转后的细胞继续培养2天。
2.5人HSC的分化与HbF的表达检测
红系分化步骤如下:
StemSpan SFEMⅡ(stem cell,09655)StemSpanTM Erythroid ExpansionSupplement(100X)(STEMCELL 02692)抗体CD71-FITC(Biolegend 334104)CD235a-PE(Biolegend 349106)
将细胞按照1*104/ml均匀地铺在24孔板中,在第三天或者第四天的时候补加等体积的新的培养基,第7天时,收集细胞,200G离心5-10min,随后用新的培养基均匀的铺在24孔板中,此时细胞密度<1*105/ml。第10天时,补加等体积的新的培养基。第14天时,收集细胞做流式检测(图4,5,6,7)。
红系分化流式检测
CD71-FITC(Biolegend 334104)CD235a-PE(Biolegend 349106)
Buffer:含有2%FBS的PBS、抗体:CD34-FITC(eBiosicience 11034941)
空白对照组;CD71单染管;CD235a单染管;CD71和CD235a双染管
①每组收集5*105个细胞,重悬至100ul体积;
②空白对照组不加抗体,CD71单染管加入5ul CD71-FITC抗体;CD235a单染管加入5ul CD235a-PE抗体;CD71和CD235a双染管加入5ul CD71-FITC和5ul CD235a-PE抗体;
③避光、冰上孵育30min;
④1000rpm,离心5min,弃去上清,加入1ml buffer,轻轻吹打均匀,1000rpm,离心5min,弃去上清;
⑤用buffer将细胞重悬至300ul,上机,流式检测。
荧光定量PCR检测HBG的mRNA水平:
①提取分化后细胞的RNA;
②取500ng RNA做为反转录模板,按照反转录试剂盒(Toyobo FSK-100CH)反转录RNA;
③用10ul H2O溶解cDNA,再稀释到100ul作为Q-PCR模板。
Q-PCR体系:
得到的分化的细胞中HBG的mRNA水平显著升高(图8)。
实施例3
本实施例中,在病人分离得到的造血干细胞(HSC)中,利用碱基编辑***的蛋白与sgRNA的RNA形成RNP形式实现碱基编辑,检测HBG表达变化。
3.1sgRNA质粒构建与体外转录
同实施例2。
3.2病人HSC的获取
可以使用熟知的技术来从患者的骨髓收获造血干细胞(HSC)。
3.3病人HSC的分离培养与电转
同实施例2。
分离得到的CD34+造血干细胞以6×104/ml的浓度培养在StemSpan SFEM培养基中,培养基中添加细胞因子100ul/ml:StemSpanTM CD34+Expansion Supplement(10X)(STEMCELL 02691)。细胞培养在37℃温箱,5%CO2条件,预刺激24小时。将相应的碱基编辑***蛋白与相应的sgRNA在37℃孵育10分钟,利用LONZA Nucleofector 2b进行电转,程序选择U-008。电转后的细胞继续培养2天。
3.4病人HSC的回输
将所得的编辑后的HSC静脉回输回病人体内。
以上所述仅为本发明较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110> 国家卫生健康委科学技术研究所
<120> 基因组碱基编辑增加人红细胞中胎儿血红蛋白水平的试剂盒及应用
<160> 39
<170> SIPOSequenceListing 1.0
<210> 1
<211> 23
<212> DNA
<213> 人工序列()
<400> 1
cttgaccaat agccttgaca agg 23
<210> 2
<211> 23
<212> DNA
<213> 人工序列()
<400> 2
gctattggtc aaggcaaggc tgg 23
<210> 3
<211> 23
<212> DNA
<213> 人工序列()
<400> 3
ccctggctaa actccaccca tgg 23
<210> 4
<211> 23
<212> DNA
<213> 人工序列()
<400> 4
atatttgcat tgagatagtg tgg 23
<210> 5
<211> 22
<212> DNA
<213> 人工序列()
<400> 5
ccttccccac actatctcaa tg 22
<210> 6
<211> 23
<212> DNA
<213> 人工序列()
<400> 6
gtggggaagg ggcccccaag agg 23
<210> 7
<211> 8532
<212> DNA
<213> 人工序列()
<400> 7
gatcccctag ggtcgactct cagtacaatc tgctctgatg ccgcatagtt aagccagtat 60
ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg cgagcaaaat ttaagctaca 120
acaaggcaag gcttgaccga caattgcatg aagaatctgc ttagggttag gcgttttgcg 180
ctgcttcgcg atgtacgggc cagatatacg cgttgacatt gattattgac tagttattaa 240
tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa 300
cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata 360
atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 420
tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc 480
cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 540
tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg 600
cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt 660
ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca 720
aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt acggtgggag 780
gtctatataa gcagagctgg tttagtgaac cgtcagatcc gctagagatc cgcggccgct 840
aatacgactc actataggga gagccgccac catgagctca gagactggcc cagtggctgt 900
ggaccccaca ttgagacggc ggatcgagcc ccatgagttt gaggtattct tcgatccgag 960
agagctccgc aaggagacct gcctgcttta cgaaattaat tgggggggcc ggcactccat 1020
ttggcgacat acatcacaga acactaacaa gcacgtcgaa gtcaacttca tcgagaagtt 1080
cacgacagaa agatatttct gtccgaacac aaggtgcagc attacctggt ttctcagctg 1140
gagcccatgc ggcgaatgta gtagggccat cactgaattc ctgtcaaggt atccccacgt 1200
cactctgttt atttacatcg caaggctgta ccaccacgct gacccccgca atcgacaagg 1260
cctgcgggat ttgatctctt caggtgtgac tatccaaatt atgactgagc aggagtcagg 1320
atactgctgg agaaactttg tgaattatag cccgagtaat gaagcccact ggcctaggta 1380
tccccatctg tgggtacgac tgtacgttct tgaactgtac tgcatcatac tgggcctgcc 1440
tccttgtctc aacattctga gaaggaagca gccacagctg acattcttta ccatcgctct 1500
tcagtcttgt cattaccagc gactgccccc acacattctc tgggccaccg ggttgaaaag 1560
cggcagcgag actcccggga cctcagagtc cgccacaccc gaaagtgata aaaagtattc 1620
tattggttta gccatcggca ctaattccgt tggatgggct gtcataaccg atgaatacaa 1680
agtaccttca aagaaattta aggtgttggg gaacacagac cgtcattcga ttaaaaagaa 1740
tcttatcggt gccctcctat tcgatagtgg cgaaacggca gaggcgactc gcctgaaacg 1800
aaccgctcgg agaaggtata cacgtcgcaa gaaccgaata tgttacttac aagaaatttt 1860
tagcaatgag atggccaaag ttgacgattc tttctttcac cgtttggaag agtccttcct 1920
tgtcgaagag gacaagaaac atgaacggca ccccatcttt ggaaacatag tagatgaggt 1980
ggcatatcat gaaaagtacc caacgattta tcacctcaga aaaaagctag ttgactcaac 2040
tgataaagcg gacctgaggt taatctactt ggctcttgcc catatgataa agttccgtgg 2100
gcactttctc attgagggtg atctaaatcc ggacaactcg gatgtcgaca aactgttcat 2160
ccagttagta caaacctata atcagttgtt tgaagagaac cctataaatg caagtggcgt 2220
ggatgcgaag gctattctta gcgcccgcct ctctaaatcc cgacggctag aaaacctgat 2280
cgcacaatta cccggagaga agaaaaatgg gttgttcggt aaccttatag cgctctcact 2340
aggcctgaca ccaaatttta agtcgaactt cgacttagct gaagatgcca aattgcagct 2400
tagtaaggac acgtacgatg acgatctcga caatctactg gcacaaattg gagatcagta 2460
tgcggactta tttttggctg ccaaaaacct tagcgatgca atcctcctat ctgacatact 2520
gagagttaat actgagatta ccaaggcgcc gttatccgct tcaatgatca aaaggtacga 2580
tgaacatcac caagacttga cacttctcaa ggccctagtc cgtcagcaac tgcctgagaa 2640
atataaggaa atattctttg atcagtcgaa aaacgggtac gcaggttata ttgacggcgg 2700
agcgagtcaa gaggaattct acaagtttat caaacccata ttagagaaga tggatgggac 2760
ggaagagttg cttgtaaaac tcaatcgcga agatctactg cgaaagcagc ggactttcga 2820
caacggtagc attccacatc aaatccactt aggcgaattg catgctatac ttagaaggca 2880
ggaggatttt tatccgttcc tcaaagacaa tcgtgaaaag attgagaaaa tcctaacctt 2940
tcgcatacct tactatgtgg gacccctggc ccgagggaac tctcggttcg catggatgac 3000
aagaaagtcc gaagaaacga ttactccatg gaattttgag gaagttgtcg ataaaggtgc 3060
gtcagctcaa tcgttcatcg agaggatgac caactttgac aagaatttac cgaacgaaaa 3120
agtattgcct aagcacagtt tactttacga gtatttcaca gtgtacaatg aactcacgaa 3180
agttaagtat gtcactgagg gcatgcgtaa acccgccttt ctaagcggag aacagaagaa 3240
agcaatagta gatctgttat tcaagaccaa ccgcaaagtg acagttaagc aattgaaaga 3300
ggactacttt aagaaaattg aatgcttcga ttctgtcgag atctccgggg tagaagatcg 3360
atttaatgcg tcacttggta cgtatcatga cctcctaaag ataattaaag ataaggactt 3420
cctggataac gaagagaatg aagatatctt agaagatata gtgttgactc ttaccctctt 3480
tgaagatcgg gaaatgattg aggaaagact aaaaacatac gctcacctgt tcgacgataa 3540
ggttatgaaa cagttaaaga ggcgtcgcta tacgggctgg ggacgattgt cgcggaaact 3600
tatcaacggg ataagagaca agcaaagtgg taaaactatt ctcgattttc taaagagcga 3660
cggcttcgcc aataggaact ttatgcagct gatccatgat gactctttaa ccttcaaaga 3720
ggatatacaa aaggcacagg tttccggaca aggggactca ttgcacgaac atattgcgaa 3780
tcttgctggt tcgccagcca tcaaaaaggg catactccag acagtcaaag tagtggatga 3840
gctagttaag gtcatgggac gtcacaaacc ggaaaacatt gtaatcgaga tggcacgcga 3900
aaatcaaacg actcagaagg ggcaaaaaaa cagtcgagag cggatgaaga gaatagaaga 3960
gggtattaaa gaactgggca gccagatctt aaaggagcat cctgtggaaa atacccaatt 4020
gcagaacgag aaactttacc tctattacct acaaaatgga agggacatgt atgttgatca 4080
ggaactggac ataaaccgtt tatctgatta cgacgtcgat cacattgtac cccaatcctt 4140
tttgaaggac gattcaatcg acaataaagt gcttacacgc tcggataaga accgagggaa 4200
aagtgacaat gttccaagcg aggaagtcgt aaagaaaatg aagaactatt ggcggcagct 4260
cctaaatgcg aaactgataa cgcaaagaaa gttcgataac ttaactaaag ctgagagggg 4320
tggcttgtct gaacttgaca aggccggatt tattaaacgt cagctcgtgg aaacccgcca 4380
aatcacaaag catgttgcac agatactaga ttcccgaatg aatacgaaat acgacgagaa 4440
cgataagctg attcgggaag tcaaagtaat cactttaaag tcaaaattgg tgtcggactt 4500
cagaaaggat tttcaattct ataaagttag ggagataaat aactaccacc atgcgcacga 4560
cgcttatctt aatgccgtcg tagggaccgc actcattaag aaatacccga agctagaaag 4620
tgagtttgtg tatggtgatt acaaagttta tgacgtccgt aagatgatcg cgaaaagcga 4680
acaggagata ggcaaggcta cagccaaata cttcttttat tctaacatta tgaatttctt 4740
taagacggaa atcactctgg caaacggaga gatacgcaaa cgacctttaa ttgaaaccaa 4800
tggggagaca ggtgaaatcg tatgggataa gggccgggac ttcgcgacgg tgagaaaagt 4860
tttgtccatg ccccaagtca acatagtaaa gaaaactgag gtgcagaccg gagggttttc 4920
aaaggaatcg attcttccaa aaaggaatag tgataagctc atcgctcgta aaaaggactg 4980
ggacccgaaa aagtacggtg gcttcgatag ccctacagtt gcctattctg tcctagtagt 5040
ggcaaaagtt gagaagggaa aatccaagaa actgaagtca gtcaaagaat tattggggat 5100
aacgattatg gagcgctcgt cttttgaaaa gaaccccatc gacttccttg aggcgaaagg 5160
ttacaaggaa gtaaaaaagg atctcataat taaactacca aagtatagtc tgtttgagtt 5220
agaaaatggc cgaaaacgga tgttggctag cgccggagag cttcaaaagg ggaacgaact 5280
cgcactaccg tctaaatacg tgaatttcct gtatttagcg tcccattacg agaagttgaa 5340
aggttcacct gaagataacg aacagaagca actttttgtt gagcagcaca aacattatct 5400
cgacgaaatc atagagcaaa tttcggaatt cagtaagaga gtcatcctag ctgatgccaa 5460
tctggacaaa gtattaagcg catacaacaa gcacagggat aaacccatac gtgagcaggc 5520
ggaaaatatt atccatttgt ttactcttac caacctcggc gctccagccg cattcaagta 5580
ttttgacaca acgatagatc gcaaacgata cacttctacc aaggaggtgc tagacgcgac 5640
actgattcac caatccatca cgggattata tgaaactcgg atagatttgt cacagcttgg 5700
gggtgactct ggtggttcta ctaatctgtc agatattatt gaaaaggaga ccggtaagca 5760
actggttatc caggaatcca tcctcatgct cccagaggag gtggaagaag tcattgggaa 5820
caagccggaa agcgatatac tcgtgcacac cgcctacgac gagagcaccg acgagaatgt 5880
catgcttctg actagcgacg cccctgaata caagccttgg gctctggtca tacaggatag 5940
caacggtgag aacaagatta agatgctctc tggtggttct cccaagaaga agaggaaagt 6000
ctaaccggtc atcatcacca tcaccattga gtttaaaccc gctgatcagc ctcgactgtg 6060
ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa 6120
ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt 6180
aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa 6240
gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc ggaaagaacc 6300
agctggggct cgataccgtc gacctctagc tagagcttgg cgtaatcatg gtcatagctg 6360
tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata 6420
aagtgtaaag cctagggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca 6480
ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc 6540
gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg 6600
cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 6660
tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 6720
aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 6780
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 6840
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 6900
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 6960
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 7020
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 7080
cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 7140
ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta 7200
tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 7260
tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 7320
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 7380
tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 7440
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 7500
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 7560
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 7620
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 7680
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 7740
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 7800
agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 7860
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 7920
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 7980
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 8040
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 8100
cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 8160
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 8220
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 8280
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 8340
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 8400
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 8460
caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcga cggatcggga 8520
gatcgatctc cc 8532
<210> 8
<211> 8580
<212> DNA
<213> 人工序列()
<400> 8
cctgtcaagg tatccccacg tcactctgtt tatttacatc gcaaggctgt accaccacgc 60
tgacccccgc aatcgacaag gcctgcggga tttgatctct tcaggtgtga ctatccaaat 120
tatgactgag caggagtcag gatactgctg gagaaacttt gtgaattata gcccgagtaa 180
tgaagcccac tggcctaggt atccccatct gtgggtacga ctgtacgttc ttgaactgta 240
ctgcatcata ctgggcctgc ctccttgtct caacattctg agaaggaagc agccacagct 300
gacattcttt accatcgctc ttcagtcttg tcattaccag cgactgcccc cacacattct 360
ctgggccacc gggttgaaat ctggtggttc ttctggtggt tctagcggca gcgagactcc 420
cgggacctca gagtccgcca cacccgaaag ttctggtggt tcttctggtg gttctgataa 480
aaagtattct attggtttag ccatcggcac taattccgtg ggctgggccg tgatcaccga 540
cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 600
caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 660
gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 720
agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 780
gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 840
ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 900
ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 960
gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 1020
gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 1080
cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 1140
aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggaa acctgattgc 1200
cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggataccaa 1260
actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 1320
cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 1380
cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 1440
gctgtacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 1500
gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 1560
tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 1620
ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 1680
gaccttcgac aacggcatca tcccccacca gatccacctg ggagagctgc acgccattct 1740
gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 1800
cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 1860
ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgaga aggtggtgga 1920
caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 1980
caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 2040
gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 2100
ccagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 2160
gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 2220
ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 2280
caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 2340
gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 2400
cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 2460
ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 2520
gaagtccgac ggcttcgcca acagaaactt catccagctg atccacgacg acagcctgac 2580
ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 2640
cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 2700
ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 2760
ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 2820
gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 2880
cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 2940
cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 3000
tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 3060
ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 3120
gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 3180
cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 3240
aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 3300
cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 3360
gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 3420
cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 3480
gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 3540
caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 3600
gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 3660
cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 3720
gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 3780
cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 3840
gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 3900
gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 3960
gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 4020
agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 4080
gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgtgc tgcagaaggg 4140
aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 4200
gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 4260
gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 4320
cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 4380
agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 4440
cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 4500
ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 4560
tcagctggga ggcgactctg gtggttctac taatctgtca gatattattg aaaaggagac 4620
cggtaagcaa ctggttatcc aggaatccat cctcatgctc ccagaggagg tggaagaagt 4680
cattgggaac aagccggaaa gcgatatact cgtgcacacc gcctacgacg agagcaccga 4740
cgagaatgtc atgcttctga ctagcgacgc ccctgaatac aagccttggg ctctggtcat 4800
acaggatagc aacggtgaga acaagattaa gatgctctct ggtggttctc ccaagaagaa 4860
gaggaaagtc taaccggtca tcatcaccat caccattgag tttaaacccg ctgatcagcc 4920
tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 4980
accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 5040
tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 5100
gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc ttctgaggcg 5160
gaaagaacca gctggggctc gataccgtcg acctctagct agagcttggc gtaatcatgg 5220
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 5280
ggaagcataa agtgtaaagc ctagggtgcc taatgagtga gctaactcac attaattgcg 5340
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 5400
ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 5460
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 5520
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 5580
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 5640
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 5700
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 5760
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 5820
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 5880
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 5940
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 6000
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 6060
agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 6120
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 6180
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 6240
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 6300
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 6360
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 6420
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 6480
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 6540
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 6600
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 6660
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 6720
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 6780
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 6840
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 6900
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 6960
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 7020
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 7080
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 7140
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 7200
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 7260
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 7320
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtcgac 7380
ggatcgggag atcgatctcc cgatccccta gggtcgactc tcagtacaat ctgctctgat 7440
gccgcatagt taagccagta tctgctccct gcttgtgtgt tggaggtcgc tgagtagtgc 7500
gcgagcaaaa tttaagctac aacaaggcaa ggcttgaccg acaattgcat gaagaatctg 7560
cttagggtta ggcgttttgc gctgcttcgc gatgtacggg ccagatatac gcgttgacat 7620
tgattattga ctagttatta atagtaatca attacggggt cattagttca tagcccatat 7680
atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac 7740
ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc 7800
cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg 7860
tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat 7920
tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc 7980
atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg atagcggttt 8040
gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac 8100
caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac gcaaatgggc 8160
ggtaggcgtg tacggtggga ggtctatata agcagagctg gtttagtgaa ccgtcagatc 8220
cgctagagat ccgcggccgc taatacgact cactataggg agagccgcca ccatgagctc 8280
agagactggc ccagtggctg tggaccccac attgagacgg cggatcgagc cccatgagtt 8340
tgaggtattc ttcgatccga gagagctccg caaggagacc tgcctgcttt acgaaattaa 8400
ttgggggggc cggcactcca tttggcgaca tacatcacag aacactaaca agcacgtcga 8460
agtcaacttc atcgagaagt tcacgacaga aagatatttc tgtccgaaca caaggtgcag 8520
cattacctgg tttctcagct ggagcccatg cggcgaatgt agtagggcca tcactgaatt 8580
<210> 9
<211> 8792
<212> DNA
<213> 人工序列()
<400> 9
tacacgtcgc aagaaccgaa tatgttactt acaagaaatt tttagcaatg agatggccaa 60
agttgacgat tctttctttc accgtttgga agagtccttc cttgtcgaag aggacaagaa 120
acatgaacgg caccccatct ttggaaacat agtagatgag gtggcatatc atgaaaagta 180
cccaacgatt tatcacctca gaaaaaagct agttgactca actgataaag cggacctgag 240
gttaatctac ttggctcttg cccatatgat aaagttccgt gggcactttc tcattgaggg 300
tgatctaaat ccggacaact cggatgtcga caaactgttc atccagttag tacaaaccta 360
taatcagttg tttgaagaga accctataaa tgcaagtggc gtggatgcga aggctattct 420
tagcgcccgc ctctctaaat cccgacggct agaaaacctg atcgcacaat tacccggaga 480
gaagaaaaat gggttgttcg gtaaccttat agcgctctca ctaggcctga caccaaattt 540
taagtcgaac ttcgacttag ctgaagatgc caaattgcag cttagtaagg acacgtacga 600
tgacgatctc gacaatctac tggcacaaat tggagatcag tatgcggact tatttttggc 660
tgccaaaaac cttagcgatg caatcctcct atctgacata ctgagagtta atactgagat 720
taccaaggcg ccgttatccg cttcaatgat caaaaggtac gatgaacatc accaagactt 780
gacacttctc aaggccctag tccgtcagca actgcctgag aaatataagg aaatattctt 840
tgatcagtcg aaaaacgggt acgcaggtta tattgacggc ggagcgagtc aagaggaatt 900
ctacaagttt atcaaaccca tattagagaa gatggatggg acggaagagt tgcttgtaaa 960
actcaatcgc gaagatctac tgcgaaagca gcggactttc gacaacggta gcattccaca 1020
tcaaatccac ttaggcgaat tgcatgctat acttagaagg caggaggatt tttatccgtt 1080
cctcaaagac aatcgtgaaa agattgagaa aatcctaacc tttcgcatac cttactatgt 1140
gggacccctg gcccgaggga actctcggtt cgcatggatg acaagaaagt ccgaagaaac 1200
gattactcca tggaattttg aggaagttgt cgataaaggt gcgtcagctc aatcgttcat 1260
cgagaggatg accaactttg acaagaattt accgaacgaa aaagtattgc ctaagcacag 1320
tttactttac gagtatttca cagtgtacaa tgaactcacg aaagttaagt atgtcactga 1380
gggcatgcgt aaacccgcct ttctaagcgg agaacagaag aaagcaatag tagatctgtt 1440
attcaagacc aaccgcaaag tgacagttaa gcaattgaaa gaggactact ttaagaaaat 1500
tgaatgcttc gattctgtcg agatctccgg ggtagaagat cgatttaatg cgtcacttgg 1560
tacgtatcat gacctcctaa agataattaa agataaggac ttcctggata acgaagagaa 1620
tgaagatatc ttagaagata tagtgttgac tcttaccctc tttgaagatc gggaaatgat 1680
tgaggaaaga ctaaaaacat acgctcacct gttcgacgat aaggttatga aacagttaaa 1740
gaggcgtcgc tatacgggct ggggacgatt gtcgcggaaa cttatcaacg ggataagaga 1800
caagcaaagt ggtaaaacta ttctcgattt tctaaagagc gacggcttcg ccaataggaa 1860
ctttatgcag ctgatccatg atgactcttt aaccttcaaa gaggatatac aaaaggcaca 1920
ggtttccgga caaggggact cattgcacga acatattgcg aatcttgctg gttcgccagc 1980
catcaaaaag ggcatactcc agacagtcaa agtagtggat gagctagtta aggtcatggg 2040
acgtcacaaa ccggaaaaca ttgtaatcga gatggcacgc gaaaatcaaa cgactcagaa 2100
ggggcaaaaa aacagtcgag agcggatgaa gagaatagaa gagggtatta aagaactggg 2160
cagccagatc ttaaaggagc atcctgtgga aaatacccaa ttgcagaacg agaaacttta 2220
cctctattac ctacaaaatg gaagggacat gtatgttgat caggaactgg acataaaccg 2280
tttatctgat tacgacgtcg atcacattgt accccaatcc tttttgaagg acgattcaat 2340
cgacaataaa gtgcttacac gctcggataa gaaccgaggg aaaagtgaca atgttccaag 2400
cgaggaagtc gtaaagaaaa tgaagaacta ttggcggcag ctcctaaatg cgaaactgat 2460
aacgcaaaga aagttcgata acttaactaa agctgagagg ggtggcttgt ctgaacttga 2520
caaggccgga tttattaaac gtcagctcgt ggaaacccgc caaatcacaa agcatgttgc 2580
acagatacta gattcccgaa tgaatacgaa atacgacgag aacgataagc tgattcggga 2640
agtcaaagta atcactttaa agtcaaaatt ggtgtcggac ttcagaaagg attttcaatt 2700
ctataaagtt agggagataa ataactacca ccatgcgcac gacgcttatc ttaatgccgt 2760
cgtagggacc gcactcatta agaaataccc gaagctagaa agtgagtttg tgtatggtga 2820
ttacaaagtt tatgacgtcc gtaagatgat cgcgaaaagc gaacaggaga taggcaaggc 2880
tacagccaaa tacttctttt attctaacat tatgaatttc tttaagacgg aaatcactct 2940
ggcaaacgga gagatacgca aacgaccttt aattgaaacc aatggggaga caggtgaaat 3000
cgtatgggat aagggccggg acttcgcgac ggtgagaaaa gttttgtcca tgccccaagt 3060
caacatagta aagaaaactg aggtgcagac cggagggttt tcaaaggaat cgattcttcc 3120
aaaaaggaat agtgataagc tcatcgctcg taaaaaggac tgggacccga aaaagtacgg 3180
tggcttcgat agccctacag ttgcctattc tgtcctagta gtggcaaaag ttgagaaggg 3240
aaaatccaag aaactgaagt cagtcaaaga attattgggg ataacgatta tggagcgctc 3300
gtcttttgaa aagaacccca tcgacttcct tgaggcgaaa ggttacaagg aagtaaaaaa 3360
ggatctcata attaaactac caaagtatag tctgtttgag ttagaaaatg gccgaaaacg 3420
gatgttggct agcgccggag agcttcaaaa ggggaacgaa ctcgcactac cgtctaaata 3480
cgtgaatttc ctgtatttag cgtcccatta cgagaagttg aaaggttcac ctgaagataa 3540
cgaacagaag caactttttg ttgagcagca caaacattat ctcgacgaaa tcatagagca 3600
aatttcggaa ttcagtaaga gagtcatcct agctgatgcc aatctggaca aagtattaag 3660
cgcatacaac aagcacaggg ataaacccat acgtgagcag gcggaaaata ttatccattt 3720
gtttactctt accaacctcg gcgctccagc cgcattcaag tattttgaca caacgataga 3780
tcgcaaacga tacacttcta ccaaggaggt gctagacgcg acactgattc accaatccat 3840
cacgggatta tatgaaactc ggatagattt gtcacagctt gggggtgact ctggtggttc 3900
tcccaagaag aagaggaaag tctaaccggt catcatcacc atcaccattg agtttaaacc 3960
cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 4020
gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 4080
attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 4140
agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 4200
gcttctgagg cggaaagaac cagctggggc tcgataccgt cgacctctag ctagagcttg 4260
gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac 4320
aacatacgag ccggaagcat aaagtgtaaa gcctagggtg cctaatgagt gagctaactc 4380
acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg 4440
cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct 4500
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 4560
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 4620
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 4680
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 4740
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 4800
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 4860
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 4920
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 4980
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 5040
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 5100
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 5160
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 5220
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 5280
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 5340
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 5400
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 5460
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 5520
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 5580
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 5640
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 5700
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 5760
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 5820
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 5880
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 5940
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 6000
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 6060
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 6120
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 6180
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 6240
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 6300
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 6360
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 6420
cctgacgtcg acggatcggg agatcgatct cccgatcccc tagggtcgac tctcagtaca 6480
atctgctctg atgccgcata gttaagccag tatctgctcc ctgcttgtgt gttggaggtc 6540
gctgagtagt gcgcgagcaa aatttaagct acaacaaggc aaggcttgac cgacaattgc 6600
atgaagaatc tgcttagggt taggcgtttt gcgctgcttc gcgatgtacg ggccagatat 6660
acgcgttgac attgattatt gactagttat taatagtaat caattacggg gtcattagtt 6720
catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc gcctggctga 6780
ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca 6840
atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca 6900
gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg 6960
cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc 7020
tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat caatgggcgt 7080
ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt 7140
ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc cgccccattg 7200
acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc tggtttagtg 7260
aaccgtcaga tccgctagag atccgcggcc gctaatacga ctcactatag ggccaccatg 7320
aagcgcaccg ccgatggttc cgagttcgaa agccccaaaa aaaagcgcaa ggtcccgaga 7380
gccgccacca tgtccgaagt cgagttttcc catgagtact ggatgagaca cgcattgact 7440
ctcgcaaaga gggcttggga tgaacgcgag gtgcccgtgg gggcagtact cgtgcataac 7500
aatcgcgtaa tcggcgaagg ttggaatagg ccgatcggac gccacgaccc cactgcacat 7560
gcggaaatca tggcccttcg acagggaggg cttgtgatgc agaattatcg acttatcgat 7620
gcgacgctgt acgtcacgct tgaaccttgc gtaatgtgcg cgggagctat gattcactcc 7680
cgcattggac gagttgtatt cggtgcccgc gacgccaaga cgggtgccgc aggttcactg 7740
atggacgtgc tgcatcaccc aggcatgaac caccgggtag aaatcacaga aggcatattg 7800
gcggacgaat gtgcggcgct gttgtccgac ttttttcgca tgcggaggca ggagatcaag 7860
gcccagaaaa aagcacaatc ctctactgac agcggcggca gcagcggcgg cagcagcggc 7920
agcgagactc ccgggacctc agagtccgcc acacccgaaa gtagcggcgg cagcagcggc 7980
ggcagctccg aagtcgagtt ttcccatgag tactggatga gacacgcatt gactctcgca 8040
aagagggctc gggatgaacg cgaggtgccc gtgggggcag tactcgtgct taacaatcgc 8100
gtaatcggcg aaggttggaa tagggcgatc ggactccacg accccactgc acatgcggaa 8160
atcatggccc ttcgacaggg agggcttgtg atgcagaatt atcgacttat cgatgcgacg 8220
ctgtacgtca cgtttgaacc ttgcgtaatg tgcgcgggag ctatgattca ctcccgcatt 8280
ggacgagttg tattcggtgt ccgcaacgcc aagacgggtg ccgcaggttc actgatggac 8340
gtgctgcatt acccaggcat gaaccaccgg gtagaaatca cagaaggcat attggcggac 8400
gaatgtgcgg cgctgttgtg ctactttttt cgcatgccga ggcaggtgtt caatgcccag 8460
aaaaaagcac aatcctctac tgacagcggc ggcagcagcg gcggcagcag cggcagcgag 8520
actcccggga cctcagagtc cgccacaccc gaaagtagcg gcggcagcag cggcggcagc 8580
gataaaaagt attctattgg tttagccatc ggcactaatt ccgttggatg ggctgtcata 8640
accgatgaat acaaagtacc ttcaaagaaa tttaaggtgt tggggaacac agaccgtcat 8700
tcgattaaaa agaatcttat cggtgccctc ctattcgata gtggcgaaac ggcagaggcg 8760
actcgcctga aacgaaccgc tcggagaagg ta 8792
<210> 10
<211> 10601
<212> DNA
<213> 人工序列()
<400> 10
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420
ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480
ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540
tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctctctgg ctaactagag 600
aacccactgc ttactggctt atcgaaatta atacgactca ctatagggag acccaagctg 660
gctagcacca tgggacccaa gaaaaaacgc aaggtggaag atcctaagaa aaagcggaaa 720
gtggacggca ttggtagtgg gagcaacggc agcagcggag aggaactgct gagcaagaac 780
taccacctgg aaaacgaggt ggccagactg aagaaaggct ctggctctgg cggaagcggt 840
tctggcggat caggatctgg aagtggcggc tctggaagcg gaggttctgg atctggcgaa 900
gaactgctgt ctaagaatta tcacctcgag aacgaagtgg ctcggctcaa gaaaggcagt 960
ggcagcggag gaagtggatc cggcggtagt ggtagtggaa gcggcggatc cggctcaggc 1020
ggatctggtt caggggaaga actcctctcc aaaaactacc atctcgagaa tgaggtcgcc 1080
cgcctgaaaa aaggatcagg ttccggtggt tctggcagcg gtggttcagg ctcaggcagc 1140
ggcggtagcg gtagcggtgg aagcggaagc ggagaagaac ttctcagcaa aaattaccac 1200
ttggagaatg aagttgcaag actcaaaaaa ggttccggca gtggcggcag cggcagcggc 1260
ggatctggta gtggatctgg tggcagtggt tcaggcggaa gtggtagcgg agaggaattg 1320
ctctcaaaga actatcattt ggagaacgag gttgcacgct tgaagaaagg cagcggatca 1380
ggcggatctg gcagcggtgg atctggttct ggatccggcg gctccggtag tggtggaagt 1440
ggctctgggg aagaattgct tagcaagaat tatcatcttg aaaatgaggt tgccaggctt 1500
aaaaaaggca gtggctccgg cggatccgga agcggaggca gcggatctgg atctggtggt 1560
tcaggatctg gcggttctgg tagcggggaa gaactgttga gtaaaaacta tcaccttgag 1620
aacgaggtcg caaggttgaa aaaaggatcc ggctctggcg gctccggaag tggcggatct 1680
ggctccggta gcggaggatc aggatccggc ggaagcggat caggcgagga actgctttcc 1740
aaaaattacc accttgaaaa cgaagtcgcc cgcctcaaga aaggttctgg cagcggaggc 1800
tctggcagtg gtggtagcgg aagtggaagt ggtggcagtg gtagcggtgg atctggaagc 1860
ggcgaggaac tcctgtcaaa gaattaccat ctcgaaaacg aggtcgcaag gctcaagaaa 1920
ggctcaggat caggcggctc tggatccggc ggttctggtt ccggctcagg tggaagtgga 1980
tctggcggct caggttccgg cgaagaattg ctttccaaga actaccattt ggaaaatgaa 2040
gtcgctcgtt tgaagaaagg ttcaggctcc ggccagcggc cgcaaggtgg aggtggaccc 2100
aagaagaagc gcaaggtgtc tagagacaag aaatactcta ttggactggc tatcgggaca 2160
aactccgttg gctgggccgt cataaccgac gagtataagg tgccaagcaa gaaattcaag 2220
gtgctgggta atactgaccg ccattcaatc aagaagaacc tgatcggagc actcctcttc 2280
gactccggtg aaaccgctga agctactcgg ctgaagcgga ccgcaaggcg gagatacacc 2340
cgccgcaaga atcggatatg ttatctgcaa gagatcttta gcaacgaaat ggctaaggtg 2400
gacgactcct tctttcaccg cctggaagag agctttctgg tggaggagga taagaaacac 2460
gagaggcacc ctatattcgg aaatatcgtg gatgaggtgg cttaccatga aaagtatcct 2520
acaatctacc atctgaggaa gaagctggtg gacagcaccg ataaagcaga cctgaggctc 2580
atctatctgg ccctggctca tatgataaag tttagaggac actttctgat cgagggcgac 2640
ctgaatcccg ataattccga tgtggataaa ctcttcattc aactggtgca gacatataac 2700
caactgttcg aggagaatcc cataaacgct tctggtgtgg atgccaaggc tattctgtcc 2760
gctcggctgt ccaagtcacg cagactggag aatctgattg cccaactgcc aggagaaaag 2820
aagaacggcc tgtttgggaa cctcatcgcc ctgagcctgg gcctgacacc taacttcaag 2880
tccaattttg atctggccga agatgctaaa ctccagctct ccaaggacac ctatgacgat 2940
gatctggaca acctgctcgc acagataggc gaccagtacg ccgatctctt tctggctgct 3000
aagaatctct ccgacgccat tctgctgagc gacatactcc gggtcaacac tgagatcacc 3060
aaagcacctc tgagcgcctc catgataaaa cgctatgatg aacaccatca agacctgact 3120
ctgctcaaag ccctcgtgag gcaacagctg ccagagaagt acaaagagat attcttcgac 3180
cagagcaaga atggatatgc cggatacatc gatggcggag catcacagga agaattttac 3240
aagttcatca aaccaatcct cgagaagatg gacggtactg aagagctgct ggtgaagctg 3300
aacagggagg acctgctgag gaagcagagg acctttgata atggctccat tccacatcag 3360
atacacctgg gagagctgca tgcaatcctc cgcaggcagg aggatttcta tcctttcctg 3420
aaggataacc gggagaagat agagaagatc ctgaccttca ggatccctta ttacgtcggc 3480
cctctggcta gaggcaactc ccgcttcgct tggatgacca ggaaatctga ggagacaatt 3540
actccttgga acttcgaaga ggtcgtggat aagggcgcaa gcgcccagtc attcatcgaa 3600
cggatgacca atttcgataa gaacctgccc aacgagaagg tcctgcccaa acattcactc 3660
ctgtacgagt atttcaccgt ctataacgag ctgactaaag tgaagtacgt gaccgagggc 3720
atgaggaagc ctgccttcct gtccggagag cagaagaagg ctatcgttga tctgctcttc 3780
aagactaata gaaaggtgac agtgaagcag ctcaaggagg attactttaa gaagatcgaa 3840
tgctttgact cagtggaaat ctctggcgtg gaggaccgct ttaatgccag cctgggcact 3900
taccatgatc tgctgaagat aatcaaagac aaagatttcc tcgataatga ggagaacgag 3960
gacatcctgg aagatatcgt gctgaccctg actctgttcg aggatagaga gatgatcgaa 4020
gagcgcctga agacctatgc ccatctgttt gacgataaag tcatgaaaca gctcaagcgg 4080
cggcgctaca ctgggtgggg tagactctcc aggaaactca taaacggcat ccgcgacaaa 4140
cagagcggaa agaccatcct ggatttcctg aaatccgacg gattcgctaa caggaacttc 4200
atgcaactga ttcacgatga ctctctgaca tttaaagagg acatccagaa ggcacaggtg 4260
agcggtcaag gcgacagcct gcacgagcac atcgccaacc tcgctggatc acccgccata 4320
aagaagggaa tactgcagac agtcaaggtc gtggacgaac tcgtcaaagt gatgggtcgg 4380
cacaagccag agaatatcgt tatcgaaatg gcaagggaga accaaaccac ccagaagggc 4440
cagaagaact ctcgggaacg gatgaaaaga atcgaagagg gaattaagga gctgggatct 4500
cagatactga aggagcaccc tgtggagaat acacagctcc agaacgagaa actctacctg 4560
tactacctcc agaacgggcg ggacatgtac gttgaccagg aactcgacat caaccggctg 4620
tccgattatg acgtggacca tattgttcca cagtccttcc tcaaagatga ctccattgac 4680
aacaaggtgc tgaccagatc cgataagaat cgcggtaagt ctgacaatgt tccatcagaa 4740
gaggtggtca agaagatgaa gaattactgg cggcagctcc tcaacgccaa actgatcacc 4800
cagcggaagt ttgacaatct gactaaggca gaaagaggag gtctgagcga actcgacaag 4860
gccggcttta ttaagaggca actggtcgaa acacgccaga ttaccaaaca cgtggcacaa 4920
atcctcgact ctaggatgaa cactaagtac gatgagaacg ataagctgat cagggaagtg 4980
aaagtgataa ctctgaagag caagctggtg tctgacttcc ggaaggactt tcaattctac 5040
aaagttcgcg aaataaacaa ttaccatcat gctcacgatg cctatctcaa tgctgtcgtt 5100
ggcaccgccc tgatcaagaa ataccctaaa ctggagtctg agttcgtgta cggtgactat 5160
aaagtctacg atgtgaggaa gatgatagca aagtctgagc aagagattgg caaagccacc 5220
gccaagtact tcttctactc taatatcatg aatttcttta agactgagat aaccctggct 5280
aacggcgaaa tccggaagcg cccactgatc gaaacaaacg gagaaacagg agaaatcgtg 5340
tgggataaag gcagggactt cgcaactgtg cggaaggtgc tgtccatgcc acaagtcaat 5400
atcgtgaaga agaccgaagt gcagaccggc ggattctcaa aggagagcat cctgccaaag 5460
cggaactctg acaagctgat cgccaggaag aaagattggg acccaaagaa gtatggcggt 5520
ttcgattccc ctacagtggc ttattccgtt ctggtcgtgg caaaagtgga gaaaggcaag 5580
tccaagaaac tcaagtctgt taaggagctg ctcggaatta ctattatgga gagatccagc 5640
ttcgagaaga atccaatcga tttcctggaa gctaagggct ataaagaagt gaagaaagat 5700
ctcatcatca aactgcccaa gtactctctc tttgagctgg agaatggtag gaagcggatg 5760
ctggcctccg ccggagagct gcagaaagga aacgagctgg ctctgccctc caaatacgtg 5820
aacttcctgt atctggcctc ccactacgag aaactcaaag gtagccctga agacaatgag 5880
cagaagcaac tctttgttga gcaacataaa cactacctgg acgaaatcat tgaacagatt 5940
agcgagttca gcaagcgggt tattctggcc gatgcaaacc tcgataaagt gctgagcgca 6000
tataataagc acagggacaa gccaattcgc gaacaagcag agaatattat ccacctcttt 6060
actctgacta atctgggcgc tcctgctgcc ttcaagtatt tcgatacaac tattgacagg 6120
aagcggtaca cctctaccaa agaagttctc gatgccaccc tgatacacca gtcaattacc 6180
ggactgtacg agactcgcat cgacctgtct cagctcggcg gcgacggttc tgaattcagc 6240
ctgggcagcg gctcccccaa gaagaagcgc aaggtgaccg gtcatcatca ccatcaccat 6300
tgagtttaaa cccgctgatc agcctcgact gtgccttcta gttgccagcc atctgttgtt 6360
tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa 6420
taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg 6480
gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc tggggatgcg 6540
gtgggctcta tggcttctga ggcggaaaga accagctggg gctctagggg gtatccccac 6600
gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct 6660
acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg 6720
ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt 6780
gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca 6840
tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga 6900
ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa 6960
gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 7020
gcgaattaat tctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag 7080
caggcagaag tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc 7140
caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag 7200
tcccgcccct aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc 7260
cccatggctg actaattttt tttatttatg cagaggccga ggccgcctct gcctctgagc 7320
tattccagaa gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcccgg 7380
gagcttgtat atccattttc ggatctgatc agcacgtgtt gacaattaat catcggcata 7440
gtatatcggc atagtataat acgacaaggt gaggaactaa accatggcca agcctttgtc 7500
tcaagaagaa tccaccctca ttgaaagagc aacggctaca atcaacagca tccccatctc 7560
tgaagactac agcgtcgcca gcgcagctct ctctagcgac ggccgcatct tcactggtgt 7620
caatgtatat cattttactg ggggaccttg tgcagaactc gtggtgctgg gcactgctgc 7680
tgctgcggca gctggcaacc tgacttgtat cgtcgcgatc ggaaatgaga acaggggcat 7740
cttgagcccc tgcggacggt gccgacaggt gcttctcgat ctgcatcctg ggatcaaagc 7800
catagtgaag gacagtgatg gacagccgac ggcagttggg attcgtgaat tgctgccctc 7860
tggttatgtg tgggagggct aagcacttcg tggccgagga gcaggactga cacgtgctac 7920
gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 7980
acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 8040
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 8100
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 8160
atcatgtctg tataccgtcg acctctagct agagcttggc gtaatcatgg tcatagctgt 8220
ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 8280
agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 8340
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 8400
cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc 8460
gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat 8520
ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca 8580
ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc 8640
atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc 8700
aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg 8760
gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta 8820
ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg 8880
ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac 8940
acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag 9000
gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat 9060
ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat 9120
ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc 9180
gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 9240
ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct 9300
agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt 9360
ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc 9420
gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac 9480
catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat 9540
cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg 9600
cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata 9660
gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta 9720
tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt 9780
gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag 9840
tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa 9900
gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc 9960
gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt 10020
taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc 10080
tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta 10140
ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa 10200
taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca 10260
tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac 10320
aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtcgac ggatcgggag 10380
atctcccgat cccctatggt gcactctcag tacaatctgc tctgatgccg catagttaag 10440
ccagtatctg ctccctgctt gtgtgttgga ggtcgctgag tagtgcgcga gcaaaattta 10500
agctacaaca aggcaaggct tgaccgacaa ttgcatgaag aatctgctta gggttaggcg 10560
ttttgcgctg cttcgcgatg tacgggccag atatacgcgt t 10601
<210> 11
<211> 7236
<212> DNA
<213> 人工序列()
<400> 11
gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900
accatgggac ctaagaaaaa gaggaaggtg gcggccgctg actacaagga tgacgacgat 960
aaatctagaa tgggtcccga catcgtgatg acccagagcc ccagcagcct gagcgccagc 1020
gtgggcgacc gcgtgaccat cacctgccgc agcagcaccg gcgccgtgac caccagcaac 1080
tacgccagct gggtgcagga gaagcccggc aagctgttca agggcctgat cggcggcacc 1140
aacaaccgcg cccccggcgt gcccagccgc ttcagcggca gcctgatcgg cgacaaggcc 1200
accctgacca tcagcagcct gcagcccgag gacttcgcca cctacttctg cgccctgtgg 1260
tacagcaacc actgggtgtt cggccagggc accaaggtgg agctgaagcg cggcggcggc 1320
ggcagcggcg gcggcggcag cggcggcggc ggcagcagcg gcggcggcag cgaggtgaag 1380
ctgctggaga gcggcggcgg cctggtgcag cccggcggca gcctgaagct gagctgcgcc 1440
gtgagcggct tcagcctgac cgactacggc gtgaactggg tgcgccaggc ccccggccgc 1500
ggcctggagt ggatcggcgt gatctggggc gacggcatca ccgactacaa cagcgccctg 1560
aaggaccgct tcatcatcag caaggacaac ggcaagaaca ccgtgtacct gcagatgagc 1620
aaggtgcgca gcgacgacac cgccctgtac tactgcgtga ccggcctgtt cgactactgg 1680
ggccagggca ccctggtgac cgtgagcagc tacccatacg atgttccaga ttacgctggt 1740
ggaggcggag gttctggggg aggaggtagt ggcggtggtg gttcaggagg cggcggatcc 1800
agcggcagcg agactcccgg gacctcagag tccgccacac ccgaaagtat gagctcagag 1860
actggcccag tggctgtgga ccccacattg agacggcgga tcgagcccca tgagtttgag 1920
gtattcttcg atccgagaga gctccgcaag gagacctgcc tgctttacga aattaattgg 1980
gggggccggc actccatttg gcgacataca tcacagaaca ctaacaagca cgtcgaagtc 2040
aacttcatcg agaagttcac gacagaaaga tatttctgtc cgaacacaag gtgcagcatt 2100
acctggtttc tcagctggag cccatgcggc gaatgtagta gggccatcac tgaattcctg 2160
tcaaggtatc cccacgtcac tctgtttatt tacatcgcaa ggctgtacca ccacgctgac 2220
ccccgcaatc gacaaggcct gcgggatttg atctcttcag gtgtgactat ccaaattatg 2280
actgagcagg agtcaggata ctgctggaga aactttgtga attatagccc gagtaatgaa 2340
gcccactggc ctaggtatcc ccatctgtgg gtacgactgt acgttcttga actgtactgc 2400
atcatactgg gcctgcctcc ttgtctcaac attctgagaa ggaagcagcc acagctgaca 2460
ttctttacca tcgctcttca gtcttgtcat taccagcgac tgcccccaca cattctctgg 2520
gccaccgggt tgaaaggcgg aggtggaagc actaatctgt cagatattat tgaaaaggag 2580
accggaaagc aactggttat ccaggaatcc atcctcatgc tcccagagga ggtggaagaa 2640
gtcattggga acaagccgga aagcgatata ctcgtgcaca ccgcctacga cgagagcacc 2700
gacgagaatg tcatgcttct gactagcgac gcccctgaat acaagccttg ggctctggtc 2760
atacaggata gcaacggtga gaacaagatt aagatgctcg gaggaggagg aagcggagga 2820
ggaggtagcg gaggaggtgg aagccggacc gaagagtaca agcttatcct gaacggtaaa 2880
accctgaaag gtgaaaccac caccgaagct gttgacgctg ctaccgcgga aaaagttttc 2940
aaacagtacg ctaacgacaa cggtgttgac ggtgaatgga cctacgacga cgctaccaaa 3000
accttcacgg taaccgaagg tggtggtagc ggtggtggtg gtagtcccaa gaagaagagg 3060
aaagtctcga gcggtggagc tgcaggaggg cccttcgaag gtaagcctat ccctaaccct 3120
ctcctcggtc tcgattctac gcgtaccggt catcatcacc atcaccattg agtttaaacc 3180
cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 3240
gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 3300
attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 3360
agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 3420
gcttctgagg cggaaagaac cagctggggc tctagggggt atccccacgc gccctgtagc 3480
ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc 3540
gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt 3600
ccccgtcaag ctctaaatcg gggcatccct ttagggttcc gatttagtgc tttacggcac 3660
ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag 3720
acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa 3780
actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg gattttgggg 3840
atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattaattc 3900
tgtggaatgt gtgtcagtta gggtgtggaa agtccccagg ctccccaggc aggcagaagt 3960
atgcaaagca tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca 4020
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta 4080
actccgccca tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga 4140
ctaatttttt ttatttatgc agaggccgag gccgcctctg cctctgagct attccagaag 4200
tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa agctcccggg agcttgtata 4260
tccattttcg gatctgatca gcacgtgttg acaattaatc atcggcatag tatatcggca 4320
tagtataata cgacaaggtg aggaactaaa ccatggccaa gcctttgtct caagaagaat 4380
ccaccctcat tgaaagagca acggctacaa tcaacagcat ccccatctct gaagactaca 4440
gcgtcgccag cgcagctctc tctagcgacg gccgcatctt cactggtgtc aatgtatatc 4500
attttactgg gggaccttgt gcagaactcg tggtgctggg cactgctgct gctgcggcag 4560
ctggcaacct gacttgtatc gtcgcgatcg gaaatgagaa caggggcatc ttgagcccct 4620
gcggacggtg tcgacaggtg cttctcgatc tgcatcctgg gatcaaagcg atagtgaagg 4680
acagtgatgg acagccgacg gcagttggga ttcgtgaatt gctgccctct ggttatgtgt 4740
gggagggcta agcacttcgt ggccgaggag caggactgac acgtgctacg agatttcgat 4800
tccaccgccg ccttctatga aaggttgggc ttcggaatcg ttttccggga cgccggctgg 4860
atgatcctcc agcgcgggga tctcatgctg gagttcttcg cccaccccaa cttgtttatt 4920
gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 4980
ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgt 5040
ataccgtcga cctctagcta gagcttggcg taatcatggt catagctgtt tcctgtgtga 5100
aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc 5160
tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc 5220
cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc 5280
ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 5340
cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 5400
ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 5460
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 5520
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 5580
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 5640
gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 5700
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 5760
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 5820
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 5880
gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 5940
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 6000
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 6060
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 6120
tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta 6180
aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt 6240
taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata 6300
gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc 6360
agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac 6420
cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag 6480
tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac 6540
gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc 6600
agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg 6660
gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc 6720
atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct 6780
gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc 6840
tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc 6900
atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc 6960
agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc 7020
gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca 7080
cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt 7140
tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt 7200
ccgcgcacat ttccccgaaa agtgccacct gacgtc 7236
<210> 12
<211> 7098
<212> DNA
<213> 人工序列()
<400> 12
gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900
accatgggac ctaagaaaaa gaggaaggtg gcggccgctg actacaagga tgacgacgat 960
aaatctagaa tgggtcccga catcgtgatg acccagagcc ccagcagcct gagcgccagc 1020
gtgggcgacc gcgtgaccat cacctgccgc agcagcaccg gcgccgtgac caccagcaac 1080
tacgccagct gggtgcagga gaagcccggc aagctgttca agggcctgat cggcggcacc 1140
aacaaccgcg cccccggcgt gcccagccgc ttcagcggca gcctgatcgg cgacaaggcc 1200
accctgacca tcagcagcct gcagcccgag gacttcgcca cctacttctg cgccctgtgg 1260
tacagcaacc actgggtgtt cggccagggc accaaggtgg agctgaagcg cggcggcggc 1320
ggcagcggcg gcggcggcag cggcggcggc ggcagcagcg gcggcggcag cgaggtgaag 1380
ctgctggaga gcggcggcgg cctggtgcag cccggcggca gcctgaagct gagctgcgcc 1440
gtgagcggct tcagcctgac cgactacggc gtgaactggg tgcgccaggc ccccggccgc 1500
ggcctggagt ggatcggcgt gatctggggc gacggcatca ccgactacaa cagcgccctg 1560
aaggaccgct tcatcatcag caaggacaac ggcaagaaca ccgtgtacct gcagatgagc 1620
aaggtgcgca gcgacgacac cgccctgtac tactgcgtga ccggcctgtt cgactactgg 1680
ggccagggca ccctggtgac cgtgagcagc tacccatacg atgttccaga ttacgctggt 1740
ggaggcggag gttctggggg aggaggtagt ggcggtggtg gttcaggagg cggcggatcc 1800
ggaggtagcg gcagcgagac tcccgggacc tcagagtccg ccacacccga aagtatggac 1860
agcctgctga tgaacaggag ggagttcctg taccagttca agaacgtcag atgggccaag 1920
ggcaggaggg agacctacct ctgctacgtg gtgaagagaa gggacagcgc cacctccttc 1980
tccctggact tcggatacct gaggaacaag aacggctgcc acgtggagct gctgttcctg 2040
aggtatatca gcgactggga cctggacccc ggcagatgtt acagggtgac ctggttcatc 2100
tcctggagcc cctgctacga ctgcgctagg cacgtggccg acttcctgag gggcaaccct 2160
aacctgagcc tgaggatctt caccgccagg ctgtacttct gcgaggacag gaaggccgaa 2220
cccgagggcc tgaggagact gcacagagcc ggagtgcaga tcgccatcat gaccttcaag 2280
gactattttt actgctggaa caccttcgtg gagaaccacg gcaggacctt caaagcctgg 2340
gagggcctgc acgagaacag cgtgaggctg tccagacagc tgaggcgtat tttactgggc 2400
ggaggtggaa gcactaatct gtcagatatt attgaaaagg agaccggaaa gcaactggtt 2460
atccaggaat ccatcctcat gctcccagag gaggtggaag aagtcattgg gaacaagccg 2520
gaaagcgata tactcgtgca caccgcctac gacgagagca ccgacgagaa tgtcatgctt 2580
ctgactagcg acgcccctga atacaagcct tgggctctgg tcatacagga tagcaacggt 2640
gagaacaaga ttaagatgct cggaggagga ggaagcggag gaggaggtag cggaggaggt 2700
ggaagccgga ccgaagagta caagcttatc ctgaacggta aaaccctgaa aggtgaaacc 2760
accaccgaag ctgttgacgc tgctaccgcg gaaaaagttt tcaaacagta cgctaacgac 2820
aacggtgttg acggtgaatg gacctacgac gacgctacca aaaccttcac ggtaaccgaa 2880
ggtggtggta gcggtggtgg tggtagtccc aagaagaaga ggaaagtctc gagcggtgga 2940
gctgcaggag ggcccttcga aggtaagcct atccctaacc ctctcctcgg tctcgattct 3000
acgcgtaccg gtcatcatca ccatcaccat tgagtttaaa cccgctgatc agcctcgact 3060
gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 3120
gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 3180
agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 3240
gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggcttctga ggcggaaaga 3300
accagctggg gctctagggg gtatccccac gcgccctgta gcggcgcatt aagcgcggcg 3360
ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct 3420
ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat 3480
cggggcatcc ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt 3540
gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg 3600
acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac 3660
cctatctcgg tctattcttt tgatttataa gggattttgg ggatttcggc ctattggtta 3720
aaaaatgagc tgatttaaca aaaatttaac gcgaattaat tctgtggaat gtgtgtcagt 3780
tagggtgtgg aaagtcccca ggctccccag gcaggcagaa gtatgcaaag catgcatctc 3840
aattagtcag caaccaggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa 3900
agcatgcatc tcaattagtc agcaaccata gtcccgcccc taactccgcc catcccgccc 3960
ctaactccgc ccagttccgc ccattctccg ccccatggct gactaatttt ttttatttat 4020
gcagaggccg aggccgcctc tgcctctgag ctattccaga agtagtgagg aggctttttt 4080
ggaggcctag gcttttgcaa aaagctcccg ggagcttgta tatccatttt cggatctgat 4140
cagcacgtgt tgacaattaa tcatcggcat agtatatcgg catagtataa tacgacaagg 4200
tgaggaacta aaccatggcc aagcctttgt ctcaagaaga atccaccctc attgaaagag 4260
caacggctac aatcaacagc atccccatct ctgaagacta cagcgtcgcc agcgcagctc 4320
tctctagcga cggccgcatc ttcactggtg tcaatgtata tcattttact gggggacctt 4380
gtgcagaact cgtggtgctg ggcactgctg ctgctgcggc agctggcaac ctgacttgta 4440
tcgtcgcgat cggaaatgag aacaggggca tcttgagccc ctgcggacgg tgtcgacagg 4500
tgcttctcga tctgcatcct gggatcaaag cgatagtgaa ggacagtgat ggacagccga 4560
cggcagttgg gattcgtgaa ttgctgccct ctggttatgt gtgggagggc taagcacttc 4620
gtggccgagg agcaggactg acacgtgcta cgagatttcg attccaccgc cgccttctat 4680
gaaaggttgg gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg 4740
gatctcatgc tggagttctt cgcccacccc aacttgttta ttgcagctta taatggttac 4800
aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt 4860
tgtggtttgt ccaaactcat caatgtatct tatcatgtct gtataccgtc gacctctagc 4920
tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 4980
attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 5040
agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 5100
tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 5160
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 5220
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 5280
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 5340
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 5400
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 5460
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 5520
agcgtggcgc tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 5580
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 5640
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 5700
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 5760
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 5820
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 5880
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 5940
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 6000
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 6060
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 6120
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 6180
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 6240
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 6300
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 6360
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 6420
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 6480
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 6540
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 6600
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 6660
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 6720
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 6780
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 6840
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 6900
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 6960
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 7020
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 7080
aaagtgccac ctgacgtc 7098
<210> 13
<211> 24
<212> DNA
<213> 人工序列()
<400> 13
accgcttgac caatagcctt gaca 24
<210> 14
<211> 24
<212> DNA
<213> 人工序列()
<400> 14
aaactgtcaa ggctattggt caag 24
<210> 15
<211> 24
<212> DNA
<213> 人工序列()
<400> 15
accggctatt ggtcaaggca aggc 24
<210> 16
<211> 24
<212> DNA
<213> 人工序列()
<400> 16
aaacgccttg ccttgaccaa tagc 24
<210> 17
<211> 24
<212> DNA
<213> 人工序列()
<400> 17
accgccctgg ctaaactcca ccca 24
<210> 18
<211> 24
<212> DNA
<213> 人工序列()
<400> 18
aaactgggtg gagtttagcc aggg 24
<210> 19
<211> 24
<212> DNA
<213> 人工序列()
<400> 19
accgatattt gcattgagat agtg 24
<210> 20
<211> 24
<212> DNA
<213> 人工序列()
<400> 20
aaaccactat ctcaatgcaa atat 24
<210> 21
<211> 24
<212> DNA
<213> 人工序列()
<400> 21
accgccttcc ccacactatc tcaa 24
<210> 22
<211> 24
<212> DNA
<213> 人工序列()
<400> 22
aaacttgaga tagtgtgggg aagg 24
<210> 23
<211> 24
<212> DNA
<213> 人工序列()
<400> 23
accggtgggg aaggggcccc caag 24
<210> 24
<211> 24
<212> DNA
<213> 人工序列()
<400> 24
aaaccttggg ggccccttcc ccac 24
<210> 25
<211> 23
<212> DNA
<213> 人工序列()
<400> 25
cgattagtga acggatctcg acg 23
<210> 26
<211> 24
<212> DNA
<213> 人工序列()
<400> 26
taggcttgac caatagcctt gaca 24
<210> 27
<211> 24
<212> DNA
<213> 人工序列()
<400> 27
aaactgtcaa ggctattggt caag 24
<210> 28
<211> 24
<212> DNA
<213> 人工序列()
<400> 28
tagggctatt ggtcaaggca aggc 24
<210> 29
<211> 24
<212> DNA
<213> 人工序列()
<400> 29
aaacgccttg ccttgaccaa tagc 24
<210> 30
<211> 24
<212> DNA
<213> 人工序列()
<400> 30
taggccctgg ctaaactcca ccca 24
<210> 31
<211> 24
<212> DNA
<213> 人工序列()
<400> 31
aaactgggtg gagtttagcc aggg 24
<210> 32
<211> 24
<212> DNA
<213> 人工序列()
<400> 32
taggatattt gcattgagat agtg 24
<210> 33
<211> 24
<212> DNA
<213> 人工序列()
<400> 33
aaaccactat ctcaatgcaa atat 24
<210> 34
<211> 24
<212> DNA
<213> 人工序列()
<400> 34
taggccttcc ccacactatc tcaa 24
<210> 35
<211> 24
<212> DNA
<213> 人工序列()
<400> 35
aaacttgaga tagtgtgggg aagg 24
<210> 36
<211> 24
<212> DNA
<213> 人工序列()
<400> 36
tagggtgggg aaggggcccc caag 24
<210> 37
<211> 24
<212> DNA
<213> 人工序列()
<400> 37
aaaccttggg ggccccttcc ccac 24
<210> 38
<211> 24
<212> DNA
<213> 人工序列()
<400> 38
tctcgcgcgt ttcggtgatg acgg 24
<210> 39
<211> 31
<212> DNA
<213> 人工序列()
<400> 39
aaaaaaagca ccgactcggt gccacttttt c 31

Claims (8)

1.一种基因组碱基编辑增加人红细胞中胎儿血红蛋白水平的试剂盒,其特征在于,包括碱基编辑***以及针对γ-球蛋白基因启动子位点的sgRNA。
2.如权利要求1所述的试剂盒,其特征在于,所述的碱基编辑***为BE3、xBE3、ABE、BE-PLUS或BE-PLUS(AID)中的一种。
3.如权利要求1所述的试剂盒,其特征在于,所述的碱基编辑***为质粒、mRNA或蛋白形式。
4.如权利要求1所述的试剂盒,其特征在于,所述的sgRNA为质粒形式,或RNA形式。
5.如权利要求1所述的试剂盒,其特征在于,所述的针对γ-球蛋白基因启动子的sgRNA的序列为SEQ ID NO.1,SEQ ID NO.2,SEQ ID NO.3,SEQ ID NO.4,SEQ ID NO.5或SEQ IDNO.6。
6.一种碱基编辑改变目的基因表达水平的方法,其特征在于,在造血干细胞中,利用针对γ-球蛋白基因启动子位点的sgRNA引导碱基编辑***到突变位点进行碱基编辑,收集转染后的细胞。
7.如权利要求6所述的碱基编辑改变目的基因表达水平的方法,其特征在于,所述的针对γ-球蛋白基因启动子位点的sgRNA通过根据该位点设计,并构建U6启动子和/或T7启动子的表达载体得到。
8.一种碱基编辑治疗血红蛋白病的方法,包括:在含有β-球蛋白基因突变的病人的HSC中,利用针对γ-球蛋白基因启动子区域的sgRNA引导碱基编辑***到该位点进行碱基编辑修复,收集转染后的细胞,鉴定突变率,HSC分化后鉴定γ-球蛋白的表达变化。
CN201910338688.7A 2019-04-25 2019-04-25 基因组碱基编辑增加人红细胞中胎儿血红蛋白水平的试剂盒及应用 Pending CN110042124A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910338688.7A CN110042124A (zh) 2019-04-25 2019-04-25 基因组碱基编辑增加人红细胞中胎儿血红蛋白水平的试剂盒及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910338688.7A CN110042124A (zh) 2019-04-25 2019-04-25 基因组碱基编辑增加人红细胞中胎儿血红蛋白水平的试剂盒及应用

Publications (1)

Publication Number Publication Date
CN110042124A true CN110042124A (zh) 2019-07-23

Family

ID=67279340

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910338688.7A Pending CN110042124A (zh) 2019-04-25 2019-04-25 基因组碱基编辑增加人红细胞中胎儿血红蛋白水平的试剂盒及应用

Country Status (1)

Country Link
CN (1) CN110042124A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022143694A1 (zh) * 2020-12-28 2022-07-07 华东师范大学 一种针对细胞中单个或多个基因进行基因编辑的方法、产品和应用
WO2023052366A1 (en) * 2021-09-28 2023-04-06 INSERM (Institut National de la Santé et de la Recherche Médicale) Base editing approaches for the treatment of beta-hemoglobinopathies

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104284669A (zh) * 2012-02-24 2015-01-14 弗雷德哈钦森癌症研究中心 治疗血红蛋白病的组合物和方法
CN107164377A (zh) * 2017-06-12 2017-09-15 王小平 基于碱基编辑的基因敲除方法及其应用
CN107208093A (zh) * 2014-09-04 2017-09-26 纪念斯隆-凯特琳癌症中心 用于治疗血红蛋白病的球蛋白基因治疗
WO2018170184A1 (en) * 2017-03-14 2018-09-20 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
WO2018209158A2 (en) * 2017-05-10 2018-11-15 Editas Medicine, Inc. Crispr/rna-guided nuclease systems and methods

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104284669A (zh) * 2012-02-24 2015-01-14 弗雷德哈钦森癌症研究中心 治疗血红蛋白病的组合物和方法
CN107208093A (zh) * 2014-09-04 2017-09-26 纪念斯隆-凯特琳癌症中心 用于治疗血红蛋白病的球蛋白基因治疗
WO2018170184A1 (en) * 2017-03-14 2018-09-20 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
WO2018209158A2 (en) * 2017-05-10 2018-11-15 Editas Medicine, Inc. Crispr/rna-guided nuclease systems and methods
CN107164377A (zh) * 2017-06-12 2017-09-15 王小平 基于碱基编辑的基因敲除方法及其应用

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022143694A1 (zh) * 2020-12-28 2022-07-07 华东师范大学 一种针对细胞中单个或多个基因进行基因编辑的方法、产品和应用
WO2023052366A1 (en) * 2021-09-28 2023-04-06 INSERM (Institut National de la Santé et de la Recherche Médicale) Base editing approaches for the treatment of beta-hemoglobinopathies

Similar Documents

Publication Publication Date Title
US20230053915A1 (en) Directed editing of cellular rna via nuclear delivery of crispr/cas9
KR101666228B1 (ko) 생물치료학적 분자를 발현시키기 위한 치료학적 유전자-스위치 작제물 및 생물반응기, 및 이의 용도
KR102494564B1 (ko) 말라리아 백신
CN110684804B (zh) 递送外源rnp的慢病毒载体及其制备方法
JP2024037917A (ja) 組換えt細胞受容体遺伝子を用いて細胞ベースの治療薬を製造するための技法
JP2003534775A (ja) タンパク質を不安定化する方法とその使用
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
KR102614328B1 (ko) T-세포 수용체 합성 및 tcr-제시 세포에 대한 안정적인 게놈 통합을 위한 2-부분 디바이스
CN110042124A (zh) 基因组碱基编辑增加人红细胞中胎儿血红蛋白水平的试剂盒及应用
KR20070114761A (ko) Siv­pedf 벡터를 사용한 안조직 세포에 있어서의아포토시스 변성을 동반하는 질환의 치료제
CN101160139A (zh) 含有pedf以及fgf2的伴随眼组织细胞凋亡变性的疾患的治疗药物
KR20160003691A (ko) Opa1 단상부족에 의해 원인이 되는 질병 치료를 위한 인공전사인자
US11814412B2 (en) Artificial proteins and compositions and methods thereof
CN113088533B (zh) 一种高效表达藤壶粘胶蛋白的酵母工程菌及其制备方法
KR20230082026A (ko) 유전자의 발현을 동시에 조절하기 위한 조성물 및 방법
CN101605891A (zh) PrP基因的遗传学消融使用靶定启动子陷阱法生产作为治疗剂的无血清重组蛋白的细胞
KR102393402B1 (ko) 세포 내 존재 단백질과 세포 외부로 분비되는 단백질을 동시 발현하는 이중발현벡터를 포함하는 암의 예방 또는 치료용 조성물
KR100884214B1 (ko) Caev-계 벡터 시스템
US20240165154A1 (en) Methods and agents for modulating adoptive immunotherapy
CN109666673B (zh) 利用碱基编辑修复与胆固醇酯贮积症相关的e8sjm-1g&gt;a突变的试剂和方法
KR20230117327A (ko) 가용성 알칼리성 포스파타제 작제물 및 가용성 알칼리성 포스파타제 작제물을 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터
KR20240022571A (ko) Rna-가이드된 이펙터 동원을 위한 시스템, 방법 및 성분
KR20230005965A (ko) 바이러스 감염 관련 질환 또는 증후군의 치료 및/또는 예방
CN101538320A (zh) 能特异上调ho-1基因表达的人工锌指蛋白转录因子及其应用
CN116710108A (zh) 用于同时调节诸基因表达的组合物和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination