CN110669794B - 以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用 - Google Patents

以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用 Download PDF

Info

Publication number
CN110669794B
CN110669794B CN201910939081.4A CN201910939081A CN110669794B CN 110669794 B CN110669794 B CN 110669794B CN 201910939081 A CN201910939081 A CN 201910939081A CN 110669794 B CN110669794 B CN 110669794B
Authority
CN
China
Prior art keywords
organism
resistance gene
sgrna
target sequence
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910939081.4A
Other languages
English (en)
Other versions
CN110669794A (zh
Inventor
杨进孝
杨永星
赵思
李璐
袁爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Academy of Agriculture and Forestry Sciences
Original Assignee
Beijing Academy of Agriculture and Forestry Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Academy of Agriculture and Forestry Sciences filed Critical Beijing Academy of Agriculture and Forestry Sciences
Priority to CN201910939081.4A priority Critical patent/CN110669794B/zh
Publication of CN110669794A publication Critical patent/CN110669794A/zh
Application granted granted Critical
Publication of CN110669794B publication Critical patent/CN110669794B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了以突变的筛选剂抗性基因为报告体系的C·T碱基替换的细胞富集技术及其应用。所述细胞富集技术包括如下试剂:sgRNA、C·T碱基替换***和功能丧失的筛选剂抗性基因;sgRNA由靶向目标基因靶点序列的tRNA‑sgRNA和靶向功能丧失的筛选剂抗性基因靶点序列的tRNA‑sgRNA组成;功能丧失的筛选剂抗性基因为将筛选剂抗性基因进行无功能突变后得到的序列;C·T碱基替换***可通过对含有所述突变位点的靶序列进行C·T碱基替换使功能丧失的筛选剂抗性基因功能恢复。本发明实现了细胞水平上C·T碱基替换细胞富集,大大提高C·T碱基替换效率。

Description

以突变的筛选剂抗性基因为报告体系的C·T碱基替换的细胞 富集技术及其应用
技术领域
本发明涉及生物技术领域,具体涉及以突变的筛选剂抗性基因为报告体系的C·T碱基替换的细胞富集技术及其应用。
背景技术
CRISPR-Cas9技术已经成为强有力的基因组编辑手段,被广泛应用到很多组织和细胞中。CRISPR/Cas9 protein-RNA复合物通过向导RNA(guide RNA)定位于靶点上,切割产生DNA双链断裂(dsDNA break,DSB),而后生物体会本能的启动DNA修复机制修复DSB。修复机制一般有两种,一种是非同源末端连接(non-homologous end joining,NHEJ),另一种是同源重组(homology-directed repair,HDR)。通常情况下NHEJ占大多数,因此修复产生的随机的indels(insertions or deletions)比精确修复高很多。对于碱基精确替换,因为HDR效率低以及需要DNA模板,所以使用HDR实现碱基精确替换的应用受到很大的限制。
2016年,David Liu和Akihiko Kondo两个实验室分别独立报道了两种不同类型的胞嘧啶碱基编辑器(cytosine base editor,CBE),分别使用了两种不同的胞苷脱氨酶rAPOBEC1(rat APOBEC1)和PmCDA1(activation-induced cytidine deaminase(AID)ortholog from sea lamprey),原理都是通过使用胞苷脱氨酶直接实现对单个胞嘧啶(Cytosine,C)碱基进行编辑,而不再通过产生DSB和启动HDR修复,大大提高了C替换为胸腺嘧啶(Thymine,T)的碱基编辑效率。具体为dead Cas9(dCas9)或the Cas9 nickase(Cas9n)连带着rAPOBEC1或PmCDA1通过sgRNA定位到靶点,rAPOBEC1或PmCDA1催化非配对的单链DNA上的C发生胞嘧啶脱氨反应变成尿嘧啶(Uracil,U),通过DNA的修复使得U与腺嘌呤(Adenine,A)配对,又通过DNA复制,最终使得T与A配对,从而实现了C到T的转换。在所测试的编辑器中,SpCas9n(D10A)&rAPOBEC1/PmCDA1&UGI碱基编辑***(其含有尿嘧啶DNA糖化酶抑制剂(uracil DNA glycosylase inhibitor,UGI))的平均突变率较高,原因有二:一是UGI可以抑制尿嘧啶DNA糖化酶(uracil DNA glycosylase,UDG)催化清除DNA中U,二是SpCas9n(D10A)在非编辑链上产生切口,诱导真核错配修复机制或long-patch BER(base-excision repair)修复机制,促使U:G错配更多的偏好性修复成U:A。
目前,在植物中通过报告基因介导的细胞富集技术富集C·T碱基替换细胞的研究非常有限,目前尚无利用转化过程中使用筛选标记在细胞水平上实现C·T碱基替换细胞的富集,进而提高C·T碱基替换效率的报道。
发明内容
本发明的目的是提供一种以突变的筛选剂抗性基因为报告体系的C·T碱基替换的细胞富集技术,该细胞富集技术能够在细胞水平上实现C·T碱基替换细胞的富集,进而提高目标靶点的C·T碱基替换效率。
为了实现上述目的,本发明首先提供了一种成套试剂,所述成套试剂包括sgRNA或与所述sgRNA相关的生物材料、C·T碱基替换***和功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料;
所述sgRNA由靶向目标基因靶点序列的sgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA组成;
所述sgRNA结构如下:所述靶点序列转录的RNA-sgRNA骨架;
所述C·T碱基替换***包括Cas9核酸酶或与所述Cas9核酸酶相关的生物材料和胞嘧啶脱氨酶或与所述胞嘧啶脱氨酶相关的生物材料;
所述功能丧失的筛选剂抗性基因为将筛选剂抗性基因进行无功能突变后得到的序列;
所述功能丧失的筛选剂抗性基因靶点序列为含有所述突变位点的靶点序列;
所述C·T碱基替换***在靶向所述含有所述突变位点的靶点序列的sgRNA的向导下,可通过对所述突变位点进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复;
所述sgRNA骨架为S1)或S2)或S3):
S1)将序列1第571-646位中的T替换为U得到的RNA分子;
S2)将S1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子;
S3)与S1)或S2)限定的核苷酸序列具有75%或75%以上同一性且具有相同功能的RNA分子。
上述成套试剂中,所述sgRNA具体可为tRNA-sgRNA;所述tRNA-sgRNA由靶向所述目标基因靶点序列(内源靶点)的tRNA-sgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列(代理靶点)的tRNA-sgRNA组成;
所述tRNA-sgRNA结构如下:tRNA-所述靶点序列转录的RNA-sgRNA骨架;
所述tRNA为R1)或R2)或R3):
R1)将序列1第474-550位中的T替换为U得到的RNA分子;
R2)将R1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子;
R3)与R1)或R2)限定的核苷酸序列具有75%或75%以上同一性且具有相同功能的RNA分子。
上述成套试剂中,靶向所述目标基因靶点序列的个数可为一个或两个或多个;靶向所述功能丧失的筛选剂抗性基因靶点序列的个数可为一个或两个或多个。所述靶点序列大小可为15-25bp,进一步可为18-22bp,更进一步可为20bp。
所述无功能突变是指将正常的筛选剂抗性基因序列中的某一个或两个或多个碱基T突变为碱基C而使突变后的筛选剂抗性基因功能丧失,且通过对含有所述突变位点的靶点序列进行C·T碱基替换后可使功能丧失的筛选剂抗性基因功能恢复。
进一步的,所述筛选剂抗性基因可为现有技术中常见的筛选剂抗性基因,如Bar/PAT草铵膦-N-乙酰转移酶基因、PMI 6-磷酸甘露糖异构酶基因、EPSPS 5-烯醇丙酮莽草酸-3-磷酸合成酶基因等。在本发明的一个具体实施例中,所述筛选剂抗性基因为潮霉素抗性基因。
更进一步的,所述功能丧失的筛选标记基因为将正常的潮霉素抗性基因(序列5)的第272位由T突变为C,且将第274位由T突变为C后得到的序列。
所述功能丧失的筛选剂抗性基因靶点的靶序列为序列1第11574-11596位。所述功能丧失的筛选剂抗性基因靶点序列(含有突变位点的靶点序列)为序列1第11574-11593位。所述C·T碱基替换***在靶向所述含有突变位点的靶点序列的tRNA-sgRNA的向导下,可通过对所述含有突变位点的靶点序列进行C·T碱基替换,使含有突变位点的靶点序列中的第3位和第5位的碱基C均突变为碱基T,进而使筛选标记基因功能恢复。
上述成套试剂中,所述C·T碱基替换***还包括UGI或与所述UGI相关的生物材料。
上述成套试剂中,所述Cas9核酸酶包括不同来源的Cas9核酸酶或其变体、dead失活酶(dead Cas9,dCas9)或其变体、nickase切刻酶(Cas9 nickase,Cas9n)或其变体。所述不同来源的Cas9核酸酶或其变体包括来源于细菌的Cas9(如SaCas9、SaCas9-KKH等),Cas9-PAM变体(如xCas9、NG Cas9、Cas9-VQR、Cas9-VRER等),Cas9高保真酶变体(如HypaCas9、eSpCas9(1.1)、Cas9-HF1等)等。在本发明的一个具体实施例中,所述Cas9核酸酶为Cas9n,具体为SpCas9n蛋白质。在本发明的另一个具体实施例中,所述Cas9核酸酶为Cas9n,具体为HypaCas9n蛋白质。
所述胞嘧啶脱氨酶可为hAPOBE3A蛋白质、human AID蛋白质、PmCDA1蛋白质或rAPOBEC1蛋白质。在本发明的一个具体实施例中,所述胞嘧啶脱氨酶为PmCDA1蛋白质。
进一步的,所述SpCas9n蛋白质为A1)或A2)或A3):
A1)氨基酸序列是序列2所示的蛋白质;
A2)将序列表中序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
A3)在A1)或A2)的N端或/和C端连接标签得到的融合蛋白质;
与所述SpCas9n相关的生物材料为B1)至B5)中的任一种:
B1)编码所述SpCas9n的核酸分子;
B2)含有B1)所述核酸分子的表达盒;
B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物;
B5)含有B1)所述核酸分子的转基因细胞系、或含有B2)所述表达盒的转基因细胞系;
所述PmCDA1蛋白质为E1)或E2)或E3):
E1)氨基酸序列是序列3所示的蛋白质;
E2)将序列表中序列3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
E3)在E1)或E2)的N端或/和C端连接标签得到的融合蛋白质;
与所述PmCDA1蛋白质相关的生物材料为F1)至F5)中的任一种:
F1)编码所述PmCDA1蛋白质的核酸分子;
F2)含有F1)所述核酸分子的表达盒;
F3)含有F1)所述核酸分子的重组载体、或含有F2)所述表达盒的重组载体;
F4)含有F1)所述核酸分子的重组微生物、或含有F2)所述表达盒的重组微生物、或含有F3)所述重组载体的重组微生物;
F5)含有F1)所述核酸分子的转基因细胞系、或含有F2)所述表达盒的转基因细胞系;
所述UGI蛋白质为I1)或I2)或I3):
I1)氨基酸序列是序列4所示的蛋白质;
I2)将序列表中序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
I3)在I1)或I2)的N端或/和C端连接标签得到的融合蛋白质;
与所述UGI蛋白质相关的生物材料为J1)至J5)中的任一种:
J1)编码所述UGI蛋白质的核酸分子;
J2)含有J1)所述核酸分子的表达盒;
J3)含有J1)所述核酸分子的重组载体、或含有J2)所述表达盒的重组载体;
J4)含有J1)所述核酸分子的重组微生物、或含有J2)所述表达盒的重组微生物、或含有J3)所述重组载体的重组微生物;
J5)含有J1)所述核酸分子的转基因细胞系、或含有J2)所述表达盒的转基因细胞系;
与所述功能丧失的筛选剂抗性基因相关的生物材料为K1)至K4)中的任一种:
K1)含有所述功能丧失的筛选剂抗性基因的表达盒;
K2)含有所述功能丧失的筛选剂抗性基因的重组载体、或含有K1)所述表达盒的重组载体;
K3)含有所述功能丧失的筛选剂抗性基因的重组微生物、或含有K1)所述表达盒的重组微生物、或含有K2)所述重组载体的重组微生物;
K4)含有所述功能丧失的筛选剂抗性基因的转基因细胞系、或含有K1)所述表达盒的转基因细胞系。
为了使A1)、E1)、I1)中的蛋白质便于纯化,可在由序列表中序列2或序列3或序列4所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接上如下表所示的标签。
表、标签的序列
标签 残基 序列
Poly-Arg 5-6(通常为5个) RRRRR
Poly-His 2-10(通常为6个) HHHHHH
FLAG 8 DYKDDDDK
Strep-tag II 8 WSHPQFEK
c-myc 10 EQKLISEEDL
上述A2)、E2)、I2)中的蛋白质,为与序列2或序列3或序列4所示蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。所述具有75%或75%以上同一性为具有75%、具有80%、具有85%、具有90%、具有95%、具有96%、具有97%、具有98%或具有99%的同一性。
上述A2)、E2)、I2)中的蛋白质可人工合成,也可先合成其编码基因,再进行生物表达得到。
上述A2)、E2)、I2)中的蛋白质的编码基因可通过将序列1的第3529-7797位(编码序列2所示的蛋白质)、序列1的第8089-8712位(编码序列3所示的蛋白质)、序列1的第8734-9030位(编码序列4所示的蛋白质)所示的DNA序列中缺失一个或几个氨基酸残基的密码子,和/或进行一个或几个碱基对的错义突变,和/或在其5′端和/或3′端连接上表所示的标签的编码序列得到。
更进一步的,B1)所述核酸分子为b1)或b2)或b3):
b1)序列表中序列1第3529-7797位所示的cDNA分子或DNA分子;
b2)与b1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述SpCas9n的cDNA分子或DNA分子;
b3)在严格条件下与b1)或b2)限定的核苷酸序列杂交,且编码所述SpCas9n的cDNA分子或DNA分子;
F1)所述核酸分子为f1)或f2)或f3):
f1)序列表中序列1第8089-8712位所示的cDNA分子或DNA分子;
f2)与f1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述PmCDA1的cDNA分子或DNA分子;
f3)在严格条件下与f1)或f2)限定的核苷酸序列杂交,且编码所述PmCDA1的cDNA分子或DNA分子;
J1)所述核酸分子为j1)或j2)或j3):
j1)序列表中序列1的第8734-9030位所示的cDNA分子或DNA分子;
j2)与j1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述UGI的cDNA分子或DNA分子;
j3)在严格条件下与j1)或j2)限定的核苷酸序列杂交,且编码所述UGI的cDNA分子或DNA分子;
K1)所述功能丧失的筛选剂抗性基因为序列1第11305-12330位所示的DNA分子。
其中,所述核酸分子可以是DNA,如cDNA、基因组DNA或重组DNA;所述核酸分子也可以是RNA,如mRNA或hnRNA等。
本领域普通技术人员可以很容易地采用已知的方法,例如定向进化和点突变的方法,对本发明的编码所述SpCas9n或所述PmCDA1或所述UGI的核苷酸序列进行突变。那些经过人工修饰的,具有与本发明的所述SpCas9n或所述PmCDA1或所述UGI的核苷酸序列75%或者更高同一性的核苷酸,只要编码所述SpCas9n或所述PmCDA1或所述UGI且具有相同功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。
这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码序列2、3或4所示的氨基酸序列组成的蛋白质的核苷酸序列具有75%或更高,或85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
所述严格条件是在2×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次5min,又于0.5×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次15min;或,0.1×SSPE(或0.1×SSC)、0.1%SDS的溶液中,65℃条件下杂交并洗膜。
上述75%或75%以上同一性,可为80%、85%、90%或95%以上的同一性。
B2)所述的含有编码SpCas9n蛋白质的核酸分子的表达盒(SpCas9n基因表达盒),是指能够在宿主细胞中表达SpCas9n蛋白质的DNA,该DNA不但可包括启动SpCas9n基因转录的启动子,还可包括终止SpCas9n基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述SpCas9n基因表达盒的重组载体。
F2)所述的含有编码PmCDA1蛋白质的核酸分子的表达盒(PmCDA1基因表达盒),是指能够在宿主细胞中表达PmCDA1蛋白质的DNA,该DNA不但可包括启动PmCDA1基因转录的启动子,还可包括终止PmCDA1基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述PmCDA1基因表达盒的重组载体。
J2)所述的含有编码UGI蛋白质的核酸分子的表达盒(UGI基因表达盒),是指能够在宿主细胞中表达UGI蛋白质的DNA,该DNA不但可包括启动UGI基因转录的启动子,还可包括终止UGI基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述UGI基因表达盒的重组载体。
所述载体可为质粒、黏粒、噬菌体或病毒载体。在本发明的具体实施例中,所述重组载体具体为sgRNA-TP-Hyg-TP/sgRNA-GT-1重组表达载体或sgRNA-TP-Hyg-TP/sgRNA-GT-2重组表达载体。
所述sgRNA-TP-Hyg-TP/sgRNA-GT-1重组表达载体的序列为序列1。所述sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体含有六个靶点序列,序列见表1。
所述sgRNA-TP-Hyg-TP/sgRNA-GT-2重组表达载体的序列为将序列1中的前五个靶点序列依次分别替换为如下五个靶点序列ALS-T3、CDC48-T2、NRT1.1B-T3、NRT1.1B-T2、DEP1,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。
所述微生物可为酵母、细菌、藻或真菌。其中,所述细菌可为农杆菌,如农杆菌EHA105。在本发明的具体实施例中,所述重组微生物具体为含有所述sgRNA-TP-Hyg-TP/sgRNA-GT-1重组表达载体或所述sgRNA-TP-Hyg-TP/sgRNA-GT-2重组表达载体。
所述转基因细胞系不包括繁殖材料。
上述成套试剂具有如下用途:
M1)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞;
M2)制备富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的产品;
M3)提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率;
M4)制备提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率的产品;
M5)生物体或生物细胞基因组靶点序列中的C·T碱基替换;
M6)制备生物体或生物细胞靶点序列中的C·T碱基替换的产品。
上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料也属于本发明的保护范围。
为了实现上述目的,本发明还提供了上述成套试剂或上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料的新用途。
本发明提供了上述成套试剂或上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料在M1)-M6)任一种中的应用:
M1)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞;
M2)制备富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的产品;
M3)提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率;
M4)制备提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率的产品;
M5)生物体或生物细胞基因组靶点序列中的C·T碱基替换;
M6)制备生物体或生物细胞靶点序列中的C·T碱基替换的产品。
为了实现上述目的,本发明还提供了N1)或N2)或N3)或N4)或N5)所述的方法:
N1)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将上述Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的sgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因、UGI的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内,使所述Cas9核酸酶、所述sgRNA、所述胞嘧啶脱氨酶和UGI均得到表达;所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N2)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将上述Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的sgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内,使所述Cas9核酸酶、所述sgRNA、所述胞嘧啶脱氨酶均得到表达;所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N3)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将上述Cas9核酸酶、靶向目标基因靶点序列的sgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶、UGI和功能丧失的筛选剂抗性基因导入生物体或生物细胞内;所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N4)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将上述Cas9核酸酶、靶向目标基因靶点序列的sgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶和功能丧失的筛选剂抗性基因导入生物体或生物细胞内;所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N5)生物突变体的制备方法,包括如下步骤:按照N1)或N2)或N3)或N4)所述的方法对生物体的基因组进行编辑,获得生物突变体;所述生物突变体为发生C·T碱基替换的生物体。
上述方法中,所述靶向目标基因靶点序列的sgRNA为靶向目标基因靶点序列的tRNA-sgRNA,所述靶向功能丧失的筛选剂抗性基因靶点序列的sgRNA为靶向功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA。进一步的,所述转录靶向目标基因靶点序列的tRNA-sgRNA的DNA分子或所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA的DNA分子转录后得到的tRNA-sgRNA为不成熟的RNA前体,该RNA前体中的tRNA会被两种酶(RNase P和RNase Z)切割掉后得到成熟的RNA。一个重组表达载体中有多少个靶点,就会得到多少个独立的成熟的RNA,每个成熟的RNA依次由所述靶点序列转录的RNA和所述sgRNA骨架组成,或依次由所述tRNA残留的个别碱基、所述靶点序列转录的RNA和所述sgRNA骨架组成。
上述方法中,所述N1)或N3)中,所述UGI的个数可为一个或两个或多个。在本发明的具体实施例中,所述UGI的个数具体为一个。
上述方法中,所述N1)中,所述Cas9核酸酶的编码基因、所述转录靶向目标基因靶点序列的sgRNA的DNA分子、所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、所述胞嘧啶脱氨酶的编码基因和所述UGI的编码基因通过含有所述Cas9核酸酶的编码基因的表达盒、所述转录靶向目标基因靶点序列的sgRNA的DNA分子的表达盒、所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子的表达盒、所述胞嘧啶脱氨酶的编码基因的表达盒和所述UGI的编码基因的表达盒的重组载体导入生物体或生物细胞内。上述各个表达盒可通过同一个重组表达载体导入生物体或生物细胞内,也可通过两个或者多个重组表达载体共同导入生物体或生物细胞内。
在本发明的具体实施例中,上述各个表达盒通过同一个重组表达载体导入生物体或生物细胞内,所述重组表达载体具体为上述sgRNA-TP-Hyg-TP/sgRNA-GT-1重组表达载体或上述sgRNA-TP-Hyg-TP/sgRNA-GT-2重组表达载体。
上述成套试剂或应用或方法中,所述C·T碱基替换为碱基C突变为碱基T。所述碱基C可为位于所述靶点序列中任意位置的碱基C。
上述成套试剂或应用或方法中,所述生物体为P1)或P2)或P3)或P4):
P1)植物或动物;
P2)单子叶植物或双子叶植物;
P3)禾本科植物;
P4)水稻(如日本晴水稻);
所述生物细胞为Q1)或Q2)或Q3)或Q4):
Q1)植物细胞或动物细胞;
Q2)单子叶植物细胞或双子叶植物细胞;
Q3)禾本科植物细胞;
Q4)水稻细胞(如日本晴水稻细胞)。
本发明的细胞富集技术原理如下:以失活的筛选剂抗性基因为报告基因,建立一种C·T碱基替换的细胞富集技术,使得报告基因上发生了C·T碱基替换的细胞能够在含有筛选剂的培养基中生长出来,没有发生C·T碱基替换的细胞不能够在含有筛选剂的培养基中生长。在此报告基因的基础上,如果同时对内源目标基因靶点进行C·T碱基替换编辑,在含有筛选剂的培养基中生长出来的细胞有更大的概率发生内源目标基因靶点的C·T碱基替换,从而实现对内源目标基因靶点发生C·T碱基替换的细胞的富集,进而提高内源目标基因靶点的C·T碱基替换效率。
本发明具有以下优点:
1、有多种不同类型的基因可以作为报告基因,在植物中进行C·T碱基替换的细胞富集。由于各种作物的遗传转化方法(如农杆菌转化法、基因枪转化法)都有相对成熟、稳定的筛选体系,使用转化用筛选剂对应的抗性基因作为报告基因进行基因组内源突变细胞的富集,比其余的如荧光报告基因、内源除草剂抗性基因等,更具有广谱性、通用性。
2、技术设计简便,其中的代理靶点以及设计形式可以更广泛的应用到更多的筛选剂对应的抗性基因中,以满足不同作物的不同转化筛选体系的需求。
3、本发明的细胞富集技术对不同的脱氨酶介导的碱基编辑器或者是不同的Cas9酶介导的碱基编辑器均实现了细胞水平上C·T碱基替换细胞富集,大大提高C·T碱基替换效率。
附图说明
图1为细胞富集技术载体sgRNA-TP-Hyg-TP/sgRNA-GT和非细胞富集技术载体sgRNA-GT的结构示意图。
图2为细胞富集技术的工作原理示意图。
图3为重组载体的结构示意图。
图4为细胞富集技术载体sgRNA-TP-Hyg-TP/sgRNA-GT和非细胞富集技术载体sgRNA-GT在抗性愈伤中对靶点的C·T碱基替换效率比较。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。下述实施例中,如无特殊说明,序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷酸,末位均为相应DNA/RNA的3′末端核苷酸。
引物对T1由引物T1-F:5’-gtaagaaccaccagcgacac-3’和引物T1-R:5’-gtaattgtgcttggtgatgga-3’组成,用于扩增靶点ALS-T1。
引物对T2由引物T2-F:5’-aatatgccattcaggtgctgg-3’和引物T2-R:5’-atcataggcagcacatgctcc-3’组成,用于扩增靶点ALS-T2。
引物对T3由引物T3-F:5’-atggctacgaccgccgcgg-3’和引物T3-R:5’-gcctcaattttccctgtcacacgatc-3’组成,用于扩增靶点ALS-T3。
引物对T4由引物T4-F:5’-attgtggctcgtgctctacc-3’和引物T4-R:5’-agacacacccacaggaacatt-3’组成,用于扩增靶点DEP1。
引物对T5由引物T5-F:5’-cttcaaattctaatccccaatcc-3’和引物T5-R:5’-ggttgttgttgaggtttaggatc-3’组成,用于扩增靶点Waxy。
引物对T6由引物T6-F:5’-ttacgaactttataactttgtcgg-3’和引物T6-R:5’-atggaggcgatgaggaagac-3’组成,用于扩增靶点NRT1.1B-T1。
引物对T7由引物T7-F:5’-ctaatcctaccaattaacgagtcg-3’和引物T7-R:5’-accagttgaagaagcgcatc-3’组成,用于扩增靶点NRT1.1B-T2。
引物对T8由引物T8-F:5’-cctccatcctcctcaccg-3’和引物T8-R:5’-tgaccttgtggacgatggtg-3’组成,用于扩增靶点NRT1.1B-T3。
引物对T9由引物T9-F:5’-acatcgagatggagaagcgg-3’和引物T9-R:5’-ccatgctccaatcgatgaatac-3’组成,用于扩增靶点CDC48-T1。
引物对T10由引物T10-F:5’-agacaccatctgcattgttct-3’和引物T10-R:5’-ggatgtaagaaggcgacactag-3’组成,用于扩增靶点CDC48-T2。
以下实施例中,C·T碱基替换是指靶点序列中任何位置的C突变为T。
C·T碱基替换效率=发生C·T碱基替换的阳性抗性愈伤数/分析的总阳性抗性愈伤数×100%。
日本晴水稻:参考文献:梁卫红,王高华,杜京尧,等.硝普钠及其光解产物对日本晴水稻幼苗生长和5种激素标记基因表达的影响[J].河南师范大学学报(自然版),2017(2):48-52.;公众可以从北京市农林科学院获得。
恢复培养基:含有200mg/L特美汀的N6固体培养基。
筛选培养基:含有50mg/L潮霉素的N6固体培养基。
实施例1、C·T碱基替换的细胞富集技术的建立
一、C·T碱基替换的细胞富集技术载体的建立
将Cas9核酸酶、胞嘧啶脱氨酶和UGI介导的C·T碱基替换的普通技术(非细胞富集技术)载体命名为sgRNA-GT。
将Cas9核酸酶、胞嘧啶脱氨酶和UGI介导的C·T碱基替换的细胞富集技术载体命名为sgRNA-TP-Hyg-TP/sgRNA-GT。
以Cas9核酸酶为SpCas9n,胞嘧啶脱氨酶为PmCDA1为例:sgRNA-TP-Hyg-TP/sgRNA-GT和sgRNA-GT载体的结构示意图均如图1所示。
细胞富集技术载体为在非细胞富集技术载体基础上对筛选剂抗性基因进行基因突变使其功能丧失,同时在sgRNA部分加入相应的含有所述突变位点的靶点序列(代理靶点序列)后得到的载体。
以筛选剂抗性基因为潮霉素抗性基因Hygromycin为例:非细胞富集技术载体中的筛选剂抗性基因为正常的潮霉素抗性基因Hygromycin。细胞富集技术载体中的筛选剂抗性基因为突变的潮霉素抗性基因Hygromycin,突变的潮霉素抗性基因Hygromycin(称为Hygromycin-TP,简称Hyg-TP)为将正常的潮霉素抗性基因的第272位由T突变为C,且将第274位由T突变为C后得到的序列,Hyg-TP基因编码的潮霉素抗性蛋白的氨基酸序列为将正常的潮霉素抗性蛋白的第91位由异亮氨酸(密码子为ATC)突变为苏氨酸(密码子为ACC),且将第92位由丝氨酸(密码子为TCC)突变为脯氨酸(密码子为CCC)后得到的序列。
Hyg-TP序列为序列1第11305-12330位,其中,第11574-11596位为含有上述突变位点的代理靶点靶序列:caccccccgccgttcacaggggg(斜体所示的碱基为PAM序列)(序列6)。
二、C·T碱基替换的细胞富集技术的工作原理
C·T碱基替换的细胞富集技术的工作原理如图2所示。以筛选剂抗性基因为潮霉素抗性基因Hygromycin为例:在细胞富集技术中,由于潮霉素抗性基因Hygromycin含有突变位点,抗性功能丧失,在潮霉素筛选培养基中,植物无法长出抗性愈伤,当细胞富集技术中的C·T碱基替换***(由Cas9核酸酶、胞嘧啶脱氨酶和UGI组成的C·T碱基替换***)在sgRNA向导下将含有上述突变位点的靶点序列中的第3位和第5位的C均突变为T,使Hyg-TP恢复为正常的潮霉素抗性基因Hygromycin,能够正常表达,恢复抗性功能,进而使植物在潮霉素筛选培养基中长出抗性愈伤。由于长出抗性愈伤的细胞已经发生了C·T碱基替换,那么此细胞对应的内源基因发生C·T碱基替换的效率相对会更高,从而达到富集C·T碱基替换细胞的目的,实现提高植物内源靶点的C·T碱基替换效率。
实施例2、Cas9n&PmCDA1&UGI介导的细胞富集技术载体的构建及其在水稻基因组编辑中的应用
一、重组表达载体的构建
本实施例中的重组表达载体为Cas9n&PmCDA1&UGI(PCBE)介导的C·T碱基替换的普通技术载体sgRNA-GT及Cas9n&PmCDA1&UGI(PCBE)介导的C·T碱基替换的细胞富集技术载体sgRNA-TP-Hyg-TP/sgRNA-GT。各载体均为环状质粒。两种重组表达载体各元件结构示意图均如图3所示。
根据含有的靶序列不同,每种重组表达载体又各自分成两种,共有如下四种重组表达载体:sgRNA-TP-Hyg-TP/sgRNA-GT-1重组表达载体、sgRNA-TP-Hyg-TP/sgRNA-GT-2重组表达载体、sgRNA-GT-1重组表达载体、sgRNA-GT-2重组表达载体。
人工合成上述四种重组表达载体,四种重组表达载体的具体结构描述分别如下:
sgRNA-TP-Hyg-TP/sgRNA-GT-1重组表达载体的序列为序列表中的序列1。序列1的第131-467位为OsU3启动子的核苷酸序列,第474-550位、第647-723位、第820-896位、第993-1069位、第1166-1242位、第1339-1415位均为tRNA的核苷酸序列,第551-570位、第724-743位、第897-916位、第1070-1089位、第1243-1262位分别为靶向OsALS、OsCDC48、OsNRT1.1B、OsWax、OsALS基因的五个靶点序列,第1416-1435位为Hyg-TP报告基因代理靶点序列。第571-646位、第744-819位、第917-992位、第1090-1165位、第1263-1338位、第1436-1511位为sgRNA的核苷酸序列,第1512-1802位为OsU3终止子的核苷酸序列;序列1的第1809-3522位为OsUbq3启动子的核苷酸序列,第3529-7797位为SpCas9n蛋白质的编码序列(不含有终止密码子),编码序列2所示的SpCas9n蛋白质;序列1的第8089-8712位为PmCDA1蛋白质的编码序列(不含有终止密码子),编码序列3所示的PmCDA1蛋白质;序列1的第8734-9030位为UGI蛋白质的编码序列,编码序列4所示的UGI蛋白质;序列1的第9037-9231位为35S终止子的核苷酸序列,第9306-11298位为ZmUbi1启动子的核苷酸序列,第11305-12330位为Hyg-TP序列,第12357-12572位为CaMV35S polyA终止子的核苷酸序列。sgRNA-TP-Hyg-TP/sgRNA-GT-1重组表达载体中六个靶点序列见表1,靶点分别为ALS-T1、CDC48-T1、NRT1.1B-T1、Waxy、ALS-T2、Hyg-TP
sgRNA-TP-Hyg-TP/sgRNA-GT-2重组表达载体的序列为将序列1中的前五个靶点序列依次分别替换为如下五个靶点序列ALS-T3、CDC48-T2、NRT1.1B-T3、NRT1.1B-T2、DEP1,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。
sgRNA-GT-1重组表达载体的序列为将序列1第11305-12330位替换为序列5所示的正常的潮霉素抗性基因序列,且保持其他序列不变后得到的序列。
sgRNA-GT-2重组表达载体将sgRNA-GT-1重组表达载体中的前五个靶点序列依次分别替换为如下五个靶点序列ALS-T3、CDC48-T2、NRT1.1B-T3、NRT1.1B-T2、DEP1,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。
各载体的sgRNA的靶点核苷酸序列及相应的PAM序列如表1所示。
表1
Figure BDA0002222385690000111
Figure BDA0002222385690000121
二、水稻阳性抗性愈伤的获得
将步骤一获得的sgRNA-TP-Hyg-TP/sgRNA-GT-1载体,sgRNA-TP-Hyg-TP/sgRNA-GT-2载体,sgRNA-GT-1载体和sgRNA-GT-2载体分别按照如下步骤1-8进行操作:
1、将载体导入农杆菌EHA105(上海唯地生物技术有限公司的产品,CAT#:AC1010),得到重组农杆菌。
2、采用培养基(含50μg/ml卡那霉素和25μg/ml利福平的YEP培养基)培养重组农杆菌,28℃,150rpm震荡培养至OD600为1.0-2.0,室温条件下,10000rpm离心1min,用侵染液(将N6液体培养基中的糖替换为葡萄糖和蔗糖,葡萄糖和蔗糖在侵染液中的浓度分别为10g/L和20g/L)重悬菌体并稀释至OD600为0.2,得到农杆菌侵染液。
3、水稻品种日本晴成熟种子去壳脱粒,置于100mL三角瓶中,加入70%(v/v)乙醇水溶液浸泡30sec,再置于25%(v/v)次氯酸钠水溶液中,120rpm震荡灭菌30min,无菌水冲洗3次,用滤纸吸干水分,然后将种子胚朝下置于N6固体培养基上,28℃暗培养4-6周,得到水稻愈伤。
4、完成步骤3后,将水稻愈伤浸泡置于农杆菌侵染液甲(农杆菌侵染液甲为向农杆菌侵染液中加入乙酰丁香酮得到的液体,乙酰丁香酮的添加量满足乙酰丁香酮与农杆菌侵染液的体积比为25μl:50ml)中浸泡10min,然后,放在铺有两层灭菌滤纸的培养皿(内含约200ml不含农杆菌的侵染液)上,21℃暗培养1天。
5、取步骤4得到的水稻愈伤放入恢复培养基上,25-28℃暗培养3天。
6、取步骤5得到的水稻愈伤,置于筛选培养基上,28℃暗培养2周。
7、取步骤6得到的水稻愈伤,再次置于筛选培养基上,28℃暗培养2周,得到水稻抗性愈伤。
8、分别提取20-24块水稻抗性愈伤的基因组DNA并以其作为模板,采用引物F(5’-attatgtagcttgtgcgtttcg-3’)和引物R(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行PCR扩增,得到PCR扩增产物;将该PCR扩增产物进行琼脂糖凝胶电泳,然后进行如下判断:如果PCR扩增产物中含有约1150bp的DNA片段,则相应的水稻抗性愈伤为水稻阳性抗性愈伤;如果PCR扩增产物中不含有约1150bp的DNA片段,则相应的水稻抗性愈伤不为水稻阳性抗性愈伤。
三、结果分析
1、每载体分别取步骤二所获得的20-24块水稻阳性抗性愈伤的基因组DNA作为模板(独立侵染两次,获得平均值和方差),对于ALS-T1靶点,采用引物对T1进行PCR扩增,得到PCR扩增产物;对于ALS-T2靶点,采用引物对T2进行PCR扩增,得到PCR扩增产物;对于ALS-T3靶点,采用引物对T3进行PCR扩增,得到PCR扩增产物;对于DEP1靶点,采用引物对T4进行PCR扩增,得到PCR扩增产物;对于Waxy靶点,采用引物对T5进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T1靶点,采用引物对T6进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T2靶点,采用引物对T7进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T3靶点,采用引物对T8进行PCR扩增,得到PCR扩增产物;对于CDC48-T1靶点,采用引物对T9进行PCR扩增,得到PCR扩增产物;对于CDC48-T2靶点,采用引物对T10进行PCR扩增,得到PCR扩增产物。
2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生C·T碱基替换的水稻阳性抗性愈伤数,计算得出C·T碱基替换效率,结果见图4。
结果表明,通过使用细胞富集技术,ALS-T1靶点中第3位C的C·T碱基替换效率从44%增加到64%;ALS-T2靶点中第4位C的C·T碱基替换效率从29%增加到55%;ALS-T3靶点中第5位C的平均C·T碱基替换效率从40%增加到54%;NRT1.1B-T3靶点中第5位C的平均C·T碱基替换效率从40%增加到46%;NRT1.1B-T2靶点中第3位C的平均C·T碱基替换效率从20%增加到35%;Waxy靶点中第11位C的C·T碱基替换效率从4%增加到12%;CDC48-T1靶点中第3位C的平均C·T碱基替换效率从55%增加到62%;CDC48-T2靶点中第3位C的C·T碱基替换效率从0增加到15%。综上所述,通过使用细胞富集技术大部分靶点的C·T碱基替换效率提升至普通技术体系的1.2-3倍。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110>北京市农林科学院
<120>以突变的筛选剂抗性基因为报告体系的C·T碱基替换的细胞富集技术及其应用
<160>6
<170>PatentIn version 3.5
<210>1
<211>18978
<212>DNA
<213>人工序列(Artificial Sequence)
<400>1
ggtggcagga tatattgtgg tgtaaacatg gcactagcct caccgtcttc gcagacgagg 60
ccgctaagtc gcagctacgc tctcaacggc actgactagg tagtttaaac gtgcacttaa 120
ttaaggtacc gaagcaactt aaagttatca ggcatgcatg gatcttggag gaatcagatg 180
tgcagtcagg gaccatagca caagacaggc gtcttctact ggtgctacca gcaaatgctg 240
gaagccggga acactgggta cgttggaaac cacgtgatgt gaagaagtaa gataaactgt 300
aggagaaaag catttcgtag tgggccatga agcctttcag gacatgtatt gcagtatggg 360
ccggcccatt acgcaattgg acgacaacaa agactagtat tagtaccacc tcggctatcc 420
acatagatca aagctgattt aaaagagttg tgcagatgat ccgtggcgga tccaacaaag 480
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 540
ggctggtgca cgcgtccatg gagatccacc gttttagagc tagaaatagc aagttaaaat 600
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaaca aagcaccagt 660
ggtctagtgg tagaatagta ccctgccacg gtacagaccc gggttcgatt cccggctggt 720
gcagaccagc cagcgtctgg cgcgttttag agctagaaat agcaagttaa aataaggcta 780
gtccgttatc aacttgaaaa agtggcaccg agtcggtgca acaaagcacc agtggtctag 840
tggtagaata gtaccctgcc acggtacaga cccgggttcg attcccggct ggtgcacggc 900
gacggcgagc aagtgggttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 960
atcaacttga aaaagtggca ccgagtcggt gcaacaaagc accagtggtc tagtggtaga 1020
atagtaccct gccacggtac agacccgggt tcgattcccg gctggtgcat tgtaatcaac 1080
tccagtgtcg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 1140
tgaaaaagtg gcaccgagtc ggtgcaacaa agcaccagtg gtctagtggt agaatagtac 1200
cctgccacgg tacagacccg ggttcgattc ccggctggtg cagaacaacc aacatttggg 1260
tagttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa 1320
gtggcaccga gtcggtgcaa caaagcacca gtggtctagt ggtagaatag taccctgcca 1380
cggtacagac ccgggttcga ttcccggctg gtgcacaccc cccgccgttc acagggtttt 1440
agagctagaa atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac 1500
cgagtcggtg cttttttttt tcgttttgca ttgagttttc tccgtcgcat gtttgcagtt 1560
ttattttccg ttttgcattg aaatttctcc gtctcatgtt tgcagcgtgt tcaaaaagta 1620
cgcagctgta tttcacttat ttacggcgcc acattttcat gccgtttgtg ccaactatcc 1680
cgagctagtg aatacagctt ggcttcacac aacactggtg acccgctgac ctgctcgtac 1740
ctcgtaccgt cgtacggcac agcatttgga attaaagggt gtgatcgata ctgcttgctg 1800
ctaagcttac aaattcgggt caaggcggaa gccagcgcgc caccccacgt cagcaaatac 1860
ggaggcgcgg ggttgacggc gtcacccggt cctaacggcg accaacaaac cagccagaag 1920
aaattacagt aaaaaaaaag taaattgcac tttgatccac cttttattac ctaagtctca 1980
atttggatca cccttaaacc tatcttttca atttgggccg ggttgtggtt tggactacca 2040
tgaacaactt ttcgtcatgt ctaacttccc tttcagcaaa catatgaacc atatatagag 2100
gagatcggcc gtatactaga gctgatgtgt ttaaggtcgt tgattgcacg agaaaaaaaa 2160
atccaaatcg caacaatagc aaatttatct ggttcaaagt gaaaagatat gtttaaaggt 2220
agtccaaagt aaaacttata gataataaaa tgtggtccaa agcgtaattc actcaaaaaa 2280
aatcaacgag acgtgtacca aacggagaca aacggcatct tctcgaaatt tcccaaccgc 2340
tcgctcgccc gcctcgtctt cccggaaacc gcggtggttt cagcgtggcg gattctccaa 2400
gcagacggag acgtcacggc acgggactcc tcccaccacc caaccgccat aaataccagc 2460
cccctcatct cctctcctcg catcagctcc acccccgaaa aatttctccc caatctcgcg 2520
aggctctcgt cgtcgaatcg aatcctctcg cgtcctcaag gtacgctgct tctcctctcc 2580
tcgcttcgtt tcgattcgat ttcggacggg tgaggttgtt ttgttgctag atccgattgg 2640
tggttagggt tgtcgatgtg attatcgtga gatgtttagg ggttgtagat ctgatggttg 2700
tgatttgggc acggttggtt cgataggtgg aatcgtggtt aggttttggg attggatgtt 2760
ggttctgatg attgggggga atttttacgg ttagatgaat tgttggatga ttcgattggg 2820
gaaatcggtg tagatctgtt ggggaattgt ggaactagtc atgcctgagt gattggtgcg 2880
atttgtagcg tgttccatct tgtaggcctt gttgcgagca tgttcagatc tactgttccg 2940
ctcttgattg agttattggt gccatgggtt ggtgcaaaca caggctttaa tatgttatat 3000
ctgttttgtg tttgatgtag atctgtaggg tagttcttct tagacatggt tcaattatgt 3060
agcttgtgcg tttcgatttg atttcatatg ttcacagatt agataatgat gaactctttt 3120
aattaattgt caatggtaaa taggaagtct tgtcgctata tctgtcataa tgatctcatg 3180
ttactatctg ccagtaattt atgctaagaa ctatattaga atatcatgtt acaatctgta 3240
gtaatatcat gttacaatct gtagttcatc tatataatct attgtggtaa tttcttttta 3300
ctatctgtgt gaagattatt gccactagtt cattctactt atttctgaag ttcaggatac 3360
gtgtgctgtt actacctatc tgaatacatg tgtgatgtgc ctgttactat ctttttgaat 3420
acatgtatgt tctgttggaa tatgtttgct gtttgatccg ttgttgtgtc cttaatcttg 3480
tgctagttct taccctatct gtttggtgat tatttcttgc agtacgtaat ggactacaag 3540
gaccacgacg gggattacaa agaccacgac atagactaca aggatgacga tgacaaaatg 3600
gcaccgaaga aaaaaaggaa ggtcggaatc catggcgttc cagctgccga taagaaatat 3660
tccatcggac tcgccattgg cacgaatagc gtcggatggg ctgttattac tgatgagtac 3720
aaagttccgt ctaagaagtt caaggtgctg ggcaacacag accgccacag cataaagaaa 3780
aatctcatcg gtgcactcct tttcgatagt ggggagactg cagaagcgac aagattgaaa 3840
aggactgcga gaaggcgcta tacacggcgt aagaatagaa tctgctacct tcaggagatt 3900
ttctctaacg aaatggctaa ggtcgatgac agtttctttc atagacttga ggaatcgttc 3960
ttggttgagg aggataagaa acatgagagg cacccgatat ttggaaacat cgtggatgag 4020
gtcgcatatc atgaaaagta ccccacaatc taccacctga gaaagaaact cgttgattcc 4080
accgacaaag cggatttgag actcatctac ctcgctcttg cccatatgat aaagttccgc 4140
ggacactttc tgatcgaggg cgacctcaac cctgataata gcgacgtcga taagctcttc 4200
atccagttgg ttcaaaccta caatcagctc tttgaggaaa acccaattaa tgctagtgga 4260
gtggatgcaa aagcgatact gtcggccaga ctctccaaga gcagaaggtt ggagaacctg 4320
atcgctcaac ttcctggaga aaagaaaaac ggtctttttg ggaatttgat tgccttgtct 4380
ctgggcctca caccaaactt caagtcaaat tttgacctcg ctgaggatgc caaacttcag 4440
ttgtctaagg atacctatga tgacgatctt gacaatttgc tggcacaaat tggcgaccag 4500
tacgcggatc tgttcctcgc agcgaagaat ctgagtgatg ctattctcct ttcggacata 4560
ctcagggtta acactgagat cacaaaagca cctttgagtg cgtcgatgat taagcgctat 4620
gatgaacatc accaagacct cactttgctg aaggcccttg tgcggcagca attgccagag 4680
aagtacaaag aaatcttctt tgaccaatct aagaacggat acgctggcta tattgatgga 4740
ggagcttctc aggaggaatt ctataagttt atcaaaccta tacttgagaa gatggatggt 4800
acagaggaac tccttgttaa attgaacaga gaagatttgc tgcgcaagca acggaccttt 4860
gacaacggat caattccgca tcagatacac ctcggcgagc ttcatgccat ccttcgccgg 4920
caggaagatt tctacccctt tttgaaggac aaccgcgaga agatagaaaa aatccttacg 4980
ttccggattc cttactatgt gggtccattg gcaaggggga attcccgctt tgcgtggatg 5040
actcggaaaa gcgaggaaac tatcacaccg tggaacttcg aggaagttgt ggacaaggga 5100
gcttctgccc aatcattcat tgagaggatg actaacttcg ataagaacct gccgaacgag 5160
aaagttctcc ccaagcactc cctcctttac gagtatttca ccgtgtataa cgaacttacg 5220
aaggttaaat acgtgactga gggtatgagg aagccagcat tcttgagcgg ggaacaaaag 5280
aaagcgattg ttgatttgct gtttaaaact aatcgcaagg tgacagtcaa gcagctcaaa 5340
gaggattatt tcaagaaaat tgaatgtttc gactctgtgg agatatcagg agtcgaagat 5400
aggtttaacg cttcccttgg cacataccat gacctcctta agatcattaa ggacaaagat 5460
ttcctggata acgaggaaaa tgaggacatc ctcgaagata ttgttcttac cttgacgctg 5520
tttgaggatc gcgaaatgat cgaggaacgg cttaagacgt atgctcactt gttcgacgat 5580
aaggttatga agcagctcaa gcgtagaagg tacactggat ggggccgtct gtctagaaag 5640
ctcatcaacg gaatacgtga taaacaaagt ggcaagacaa ttttggattt tctgaagtcg 5700
gacggattcg ccaacagaaa ttttatgcag ctgattcatg acgatagtct caccttcaaa 5760
gaggacatac agaaggctca agtgagtggt caaggggatt cgctgcatga acacatcgca 5820
aacctcgcgg gttcaccggc cataaagaaa ggaatccttc aaactgttaa ggtcgttgat 5880
gagttggtta aagtgatggg taggcacaag cccgaaaaca tagtgatcga gatggctcgc 5940
gaaaatcaga ctacacaaaa agggcagaag aactctcgcg agcggatgaa aaggattgag 6000
gaaggaatca aggaactggg ctcacagatt ctcaaagagc atccagtcga aaacacacag 6060
ctgcaaaatg agaagctcta tctttactat ctccaaaatg gccgggacat gtatgttgat 6120
caggagcttg acatcaaccg tttgtccgac tatgatgtgg accacattgt cccgcaatct 6180
ttccttaagg acgattcaat cgataataag gtgttgaccc ggagcgataa aaaccgtgga 6240
aagtctgaca atgtcccttc agaggaagtg gttaagaaga tgaagaacta ctggagacaa 6300
ttgctgaatg caaaactgat cacacagaga aagttcgaca acctcaccaa agcagagaga 6360
ggtgggctca gtgaacttga taaagcgggc ttcattaagc gtcagctcgt tgagactaga 6420
cagatcacga agcatgtcgc gcagattttg gattcgcgga tgaacacgaa gtacgacgag 6480
aatgataaac tgatacgtga agtcaaggtt atcactctta agtccaaatt ggtgagcgat 6540
ttcagaaagg acttccaatt ctataaggtc agggagatca acaattatca tcacgctcac 6600
gatgcctacc ttaatgctgt tgtggggacc gcccttatta agaaataccc taaattggag 6660
tctgaattcg tttacgggga ttataaggtc tacgacgtta ggaaaatgat agctaagagt 6720
gagcaggaga tcggtaaagc aactgcgaag tatttctttt actcgaacat catgaatttc 6780
tttaagaccg agataacgct ggcaaatggc gaaattagaa agaggcctct catagagact 6840
aacggtgaga caggggaaat cgtctgggat aagggtaggg actttgcgac agtgcgcaag 6900
gtcctctcta tgccgcaagt taatattgtg aagaaaaccg aggtgcagac gggaggcttc 6960
tccaaggaaa gcatacttcc caaacggaac tctgataagt tgatcgctcg taagaaagat 7020
tgggacccta agaaatatgg tgggttcgat tccccaactg ttgcttacag cgtgctggtc 7080
gttgccaagg tcgagaaggg taaatccaag aaactcaaaa gcgttaagga actccttggg 7140
attactatca tggagagatc ttcattcgaa aagaatccta tcgactttct tgaggccaaa 7200
ggatataagg aagttaagaa agatctgata atcaaactcc caaagtactc attgtttgag 7260
ctggaaaacg gcaggaagcg catgcttgct tccgccggag agttgcagaa agggaacgag 7320
ttggctctgc cttctaagta tgttaacttc ctctatcttg cctctcatta cgagaagctc 7380
aaaggctcac cagaggacaa cgaacagaaa caactttttg tcgagcaaca taagcactat 7440
ttggatgaga ttatagaaca gatcagtgaa ttctcgaaaa gggttatcct tgcagatgcg 7500
aatcttgaca aggtgttgtc tgcatacaac aaacatagag ataagccgat cagggagcaa 7560
gcggaaaata tcattcacct cttcactctt acaaacttgg gtgctcccgc tgccttcaag 7620
tattttgata ccacgattga ccggaaacgt tacacctcaa cgaaggaggt gctggatgcc 7680
accctcatcc accaatctat taccggactc tacgagacta gaatcgatct ctcacagctc 7740
ggcggggata aaagaccagc agcgacgaaa aaggcaggac aggctaagaa gaagaaagag 7800
ctcggaggag gaggcacggg aggaggaggc tccgccgagt atgtgcgcgc gctcttcgac 7860
ttcaacggca atgacgagga ggatctccct ttcaagaagg gcgacatcct ccgcatccgc 7920
gataagccgg aggagcagtg gtggaacgca gaggactccg agggcaagcg gggcatgatc 7980
ctggtgccat acgtcgagaa gtacagcggc gattacaagg accacgatgg cgactacaag 8040
gatcatgaca tcgattacaa ggacgatgac gataagtccg gcgtcgacat gacggacgcg 8100
gagtatgtgc gcatccacga gaagctcgat atctacacct tcaagaagca gttcttcaac 8160
aataagaagt cggtgtccca tcggtgctac gtcctcttcg agctgaagcg caggggagag 8220
cgccgcgcct gcttctgggg ctacgcggtg aataagccgc agtcaggcac agagcgcggc 8280
atccacgccg agatcttctc gatccggaag gtcgaggagt acctccgcga caacccaggc 8340
cagttcacga tcaattggta ctccagctgg tccccttgcg cagattgcgc agagaagatc 8400
ctcgagtggt acaaccagga gctgaggggc aatggccata ccctcaagat ctgggcctgc 8460
aagctgtact acgagaagaa cgcgaggaat cagatcggcc tctggaacct gcgggataat 8520
ggcgtgggcc tcaacgtgat ggtgtccgag cactaccagt gctgccgcaa gatcttcatc 8580
cagtcctccc acaatcagct gaacgagaat aggtggctcg aaaagaccct gaagcgcgcc 8640
gagaagtgga ggagcgagct gtctatcatg atccaggtca agatcctgca caccacaaag 8700
tcaccggcgg tgggcggcgg cggcagcgaa ttctccggcg gcagcacgaa cctcagcgac 8760
atcatcgaga aggagacagg caagcagctc gtgatccagg agtctatcct catgctgcct 8820
gaggaggtgg aggaggtcat cggcaacaag ccggagtccg atatcctcgt gcacaccgcc 8880
tacgacgagt cgacagatga gaatgtcatg ctcctgacct ccgacgcacc agagtacaag 8940
ccatgggcgc tcgtgatcca ggattccaac ggcgagaata agatcaagat gctgtctggc 9000
ggctccccga agaagaagcg caaggtctag actagtctga aatcaccagt ctctctctac 9060
aaatctatct ctctctataa taatgtgtga gtagttccca gataagggaa ttagggttct 9120
tatagggttt cgctcatgtg ttgagcatat aagaaaccct tagtatgtat ttgtatttgt 9180
aaaatacttc tatcaataaa atttctaatt cctaaaacca aaatccagtg gggcgcccga 9240
cctgtactcg cgaaggttaa cttacagaga gtgtccgggc gcgcctggtg gatcgtccgc 9300
ctaggctgca gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat 9360
gtctaagtta taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt 9420
atctatcttt atacatatat ttaaacttta ctctacgaat aatataatct atagtactac 9480
aataatatca gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca 9540
attgagtatt ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc 9600
tttttttttg caaatagctt cacctatata atacttcatc cattttatta gtacatccat 9660
ttagggttta gggttaatgg tttttataga ctaatttttt tagtacatct attttattct 9720
attttagcct ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt 9780
agatataaaa tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt 9840
aaaaaaacta aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc 9900
gtcgacgagt ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa 9960
gcagacggca cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc 10020
gttggacttg ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc 10080
ggcacggcag gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc 10140
ccaccgctcc ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac 10200
cctctttccc caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa 10260
atccacccgt cggcacctcc gcttcaaggt acgccgctcg tcctcccccc ccccccctct 10320
ctaccttctc tagatcggcg ttccggtcca tggttagggc ccggtagttc tacttctgtt 10380
catgtttgtg ttagatccgt gtttgtgtta gatccgtgct gctagcgttc gtacacggat 10440
gcgacctgta cgtcagacac gttctgattg ctaacttgcc agtgtttctc tttggggaat 10500
cctgggatgg ctctagccgt tccgcagacg ggatcgattt catgattttt tttgtttcgt 10560
tgcatagggt ttggtttgcc cttttccttt atttcaatat atgccgtgca cttgtttgtc 10620
gggtcatctt ttcatgcttt tttttgtctt ggttgtgatg atgtggtctg gttgggcggt 10680
cgttctagat cggagtagaa ttctgtttca aactacctgg tggatttatt aattttggat 10740
ctgtatgtgt gtgccataca tattcatagt tacgaattga agatgatgga tggaaatatc 10800
gatctaggat aggtatacat gttgatgcgg gttttactga tgcatataca gagatgcttt 10860
ttgttcgctt ggttgtgatg atgtggtgtg gttgggcggt cgttcattcg ttctagatcg 10920
gagtagaata ctgtttcaaa ctacctggtg tatttattaa ttttggaact gtatgtgtgt 10980
gtcatacatc ttcatagtta cgagtttaag atggatggaa atatcgatct aggataggta 11040
tacatgttga tgtgggtttt actgatgcat atacatgatg gcatatgcag catctattca 11100
tatgctctaa ccttgagtac ctatctatta taataaacaa gtatgtttta taattatttt 11160
gatcttgata tacttggatg atggcatatg cagcagctat atgtggattt ttttagccct 11220
gccttcatac gctatttatt tgcttggtac tgtttctttt gtcgatgctc accctgttgt 11280
ttggtgttac ttctgcagga gctcatgaaa aagcctgaac tcaccgcgac gtctgtcgag 11340
aagtttctga tcgaaaagtt cgacagcgtc tccgacctga tgcagctctc ggagggcgaa 11400
gaatctcgtg ctttcagctt cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc 11460
tgcgccgatg gtttctacaa agatcgttat gtttatcggc actttgcatc ggccgcgctc 11520
ccgattccgg aagtgcttga cattggggag tttagcgaga gcctgaccta ttgcaccccc 11580
cgccgttcac agggggtcac gttgcaagac ctgcctgaaa ccgaactgcc cgctgttcta 11640
caaccggtcg cggaggctat ggatgcgatc gctgcggccg atcttagcca gacgagcggg 11700
ttcggcccat tcggaccgca aggaatcggt caatacacta catggcgtga tttcatatgc 11760
gcgattgctg atccccatgt gtatcactgg caaactgtga tggacgacac cgtcagtgcg 11820
tccgtcgcgc aggctctcga tgagctgatg ctttgggccg aggactgccc cgaagtccgg 11880
cacctcgtgc acgcggattt cggctccaac aatgtcctga cggacaatgg ccgcataaca 11940
gcggtcattg actggagcga ggcgatgttc ggggattccc aatacgaggt cgccaacatc 12000
ttcttctgga ggccgtggtt ggcttgtatg gagcagcaga cgcgctactt cgagcggagg 12060
catccggagc ttgcaggatc gccacgactc cgggcgtata tgctccgcat tggtcttgac 12120
caactctatc agagcttggt tgacggcaat ttcgatgatg cagcttgggc gcagggtcga 12180
tgcgacgcaa tcgtccgatc cggagccggg actgtcgggc gtacacaaat cgcccgcaga 12240
agcgcggccg tctggaccga tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc 12300
cccagcactc gtccgagggc aaagaaatag agtagatgcc gaccgggatc tgtcgatcga 12360
caagctcgag tttctccata ataatgtgtg agtagttccc agataaggga attagggttc 12420
ctatagggtt tcgctcatgt gttgagcata taagaaaccc ttagtatgta tttgtatttg 12480
taaaatactt ctatcaataa aatttctaat tcctaaaacc aaaatccagt actaaaatcc 12540
agatcccccg aattaattcg gcgttaattc agcctgcagg acgcgtttaa ttaagtgcac 12600
gcggccgcct acttagtcaa gagcctcgca cgcgactgtc acgcggccag gatcgcctcg 12660
tgagcctcgc aatctgtacc tagtgtttaa actatcagtg tttgacagga tatattggcg 12720
ggtaaaccta agagaaaaga gcgtttatta gaataacgga tatttaaaag ggcgtgaaaa 12780
ggtttatccg ttcgtccatt tgtatgtgca tgccaaccac agggttcccc tcgggatcaa 12840
agtactttga tccaacccct ccgctgctat agtgcagtcg gcttctgacg ttcagtgcag 12900
ccgtcttctg aaaacgacat gtcgcacaag tcctaagtta cgcgacaggc tgccgccctg 12960
cccttttcct ggcgttttct tgtcgcgtgt tttagtcgca taaagtagaa tacttgcgac 13020
tagaaccgga gacattacgc catgaacaag agcgccgccg ctggcctgct gggctatgcc 13080
cgcgtcagca ccgacgacca ggacttgacc aaccaacggg ccgaactgca cgcggccggc 13140
tgcaccaagc tgttttccga gaagatcacc ggcaccaggc gcgaccgccc ggagctggcc 13200
aggatgcttg accacctacg ccctggcgac gttgtgacag tgaccaggct agaccgcctg 13260
gcccgcagca cccgcgacct actggacatt gccgagcgca tccaggaggc cggcgcgggc 13320
ctgcgtagcc tggcagagcc gtgggccgac accaccacgc cggccggccg catggtgttg 13380
accgtgttcg ccggcattgc cgagttcgag cgttccctaa tcatcgaccg cacccggagc 13440
gggcgcgagg ccgccaaggc ccgaggcgtg aagtttggcc cccgccctac cctcaccccg 13500
gcacagatcg cgcacgcccg cgagctgatc gaccaggaag gccgcaccgt gaaagaggcg 13560
gctgcactgc ttggcgtgca tcgctcgacc ctgtaccgcg cacttgagcg cagcgaggaa 13620
gtgacgccca ccgaggccag gcggcgcggt gccttccgtg aggacgcatt gaccgaggcc 13680
gacgccctgg cggccgccga gaatgaacgc caagaggaac aagcatgaaa ccgcaccagg 13740
acggccagga cgaaccgttt ttcattaccg aagagatcga ggcggagatg atcgcggccg 13800
ggtacgtgtt cgagccgccc gcgcacgtct caaccgtgcg gctgcatgaa atcctggccg 13860
gtttgtctga tgccaagctg gcggcctggc cggccagctt ggccgctgaa gaaaccgagc 13920
gccgccgtct aaaaaggtga tgtgtatttg agtaaaacag cttgcgtcat gcggtcgctg 13980
cgtatatgat gcgatgagta aataaacaaa tacgcaaggg gaacgcatga aggttatcgc 14040
tgtacttaac cagaaaggcg ggtcaggcaa gacgaccatc gcaacccatc tagcccgcgc 14100
cctgcaactc gccggggccg atgttctgtt agtcgattcc gatccccagg gcagtgcccg 14160
cgattgggcg gccgtgcggg aagatcaacc gctaaccgtt gtcggcatcg accgcccgac 14220
gattgaccgc gacgtgaagg ccatcggccg gcgcgacttc gtagtgatcg acggagcgcc 14280
ccaggcggcg gacttggctg tgtccgcgat caaggcagcc gacttcgtgc tgattccggt 14340
gcagccaagc ccttacgaca tatgggccac cgccgacctg gtggagctgg ttaagcagcg 14400
cattgaggtc acggatggaa ggctacaagc ggcctttgtc gtgtcgcggg cgatcaaagg 14460
cacgcgcatc ggcggtgagg ttgccgaggc gctggccggg tacgagctgc ccattcttga 14520
gtcccgtatc acgcagcgcg tgagctaccc aggcactgcc gccgccggca caaccgttct 14580
tgaatcagaa cccgagggcg acgctgcccg cgaggtccag gcgctggccg ctgaaattaa 14640
atcaaaactc atttgagtta atgaggtaaa gagaaaatga gcaaaagcac aaacacgcta 14700
agtgccggcc gtccgagcgc acgcagcagc aaggctgcaa cgttggccag cctggcagac 14760
acgccagcca tgaagcgggt caactttcag ttgccggcgg aggatcacac caagctgaag 14820
atgtacgcgg tacgccaagg caagaccatt accgagctgc tatctgaata catcgcgcag 14880
ctaccagagt aaatgagcaa atgaataaat gagtagatga attttagcgg ctaaaggagg 14940
cggcatggaa aatcaagaac aaccaggcac cgacgccgtg gaatgcccca tgtgtggagg 15000
aacgggcggt tggccaggcg taagcggctg ggttgtctgc cggccctgca atggcactgg 15060
aacccccaag cccgaggaat cggcgtgacg gtcgcaaacc atccggcccg gtacaaatcg 15120
gcgcggcgct gggtgatgac ctggtggaga agttgaaggc cgcgcaggcc gcccagcggc 15180
aacgcatcga ggcagaagca cgccccggtg aatcgtggca agcggccgct gatcgaatcc 15240
gcaaagaatc ccggcaaccg ccggcagccg gtgcgccgtc gattaggaag ccgcccaagg 15300
gcgacgagca accagatttt ttcgttccga tgctctatga cgtgggcacc cgcgatagtc 15360
gcagcatcat ggacgtggcc gttttccgtc tgtcgaagcg tgaccgacga gctggcgagg 15420
tgatccgcta cgagcttcca gacgggcacg tagaggtttc cgcagggccg gccggcatgg 15480
ccagtgtgtg ggattacgac ctggtactga tggcggtttc ccatctaacc gaatccatga 15540
accgataccg ggaagggaag ggagacaagc ccggccgcgt gttccgtcca cacgttgcgg 15600
acgtactcaa gttctgccgg cgagccgatg gcggaaagca gaaagacgac ctggtagaaa 15660
cctgcattcg gttaaacacc acgcacgttg ccatgcagcg tacgaagaag gccaagaacg 15720
gccgcctggt gacggtatcc gagggtgaag ccttgattag ccgctacaag atcgtaaaga 15780
gcgaaaccgg gcggccggag tacatcgaga tcgagctagc tgattggatg taccgcgaga 15840
tcacagaagg caagaacccg gacgtgctga cggttcaccc cgattacttt ttgatcgatc 15900
ccggcatcgg ccgttttctc taccgcctgg cacgccgcgc cgcaggcaag gcagaagcca 15960
gatggttgtt caagacgatc tacgaacgca gtggcagcgc cggagagttc aagaagttct 16020
gtttcaccgt gcgcaagctg atcgggtcaa atgacctgcc ggagtacgat ttgaaggagg 16080
aggcggggca ggctggcccg atcctagtca tgcgctaccg caacctgatc gagggcgaag 16140
catccgccgg ttcctaatgt acggagcaga tgctagggca aattgcccta gcaggggaaa 16200
aaggtcgaaa aggtctcttt cctgtggata gcacgtacat tgggaaccca aagccgtaca 16260
ttgggaaccg gaacccgtac attgggaacc caaagccgta cattgggaac cggtcacaca 16320
tgtaagtgac tgatataaaa gagaaaaaag gcgatttttc cgcctaaaac tctttaaaac 16380
ttattaaaac tcttaaaacc cgcctggcct gtgcataact gtctggccag cgcacagccg 16440
aagagctgca aaaagcgcct acccttcggt cgctgcgctc cctacgcccc gccgcttcgc 16500
gtcggcctat cgcggccgct ggccgctcaa aaatggctgg cctacggcca ggcaatctac 16560
cagggcgcgg acaagccgcg ccgtcgccac tcgaccgccg gcgcccacat caaggcaccc 16620
tgcctcgcgc gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg 16680
gtcacagctt gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg 16740
ggtgttggcg ggtgtcgggg cgcagccatg acccagtcac gtagcgatag cggagtgtat 16800
actggcttaa ctatgcggca tcagagcaga ttgtactgag agtgcaccat atgcggtgtg 16860
aaataccgca cagatgcgta aggagaaaat accgcatcag gcgctcttcc gcttcctcgc 16920
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 16980
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 17040
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 17100
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 17160
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 17220
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 17280
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 17340
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 17400
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 17460
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 17520
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 17580
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 17640
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 17700
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg cattctaggt 17760
actaaaacaa ttcatccagt aaaatataat attttatttt ctcccaatca ggcttgatcc 17820
ccagtaagtc aaaaaatagc tcgacatact gttcttcccc gatatcctcc ctgatcgacc 17880
ggacgcagaa ggcaatgtca taccacttgt ccgccctgcc gcttctccca agatcaataa 17940
agccacttac tttgccatct ttcacaaaga tgttgctgtc tcccaggtcg ccgtgggaaa 18000
agacaagttc ctcttcgggc ttttccgtct ttaaaaaatc atacagctcg cgcggatctt 18060
taaatggagt gtcttcttcc cagttttcgc aatccacatc ggccagatcg ttattcagta 18120
agtaatccaa ttcggctaag cggctgtcta agctattcgt atagggacaa tccgatatgt 18180
cgatggagtg aaagagcctg atgcactccg catacagctc gataatcttt tcagggcttt 18240
gttcatcttc atactcttcc gagcaaagga cgccatcggc ctcactcatg agcagattgc 18300
tccagccatc atgccgttca aagtgcagga cctttggaac aggcagcttt ccttccagcc 18360
atagcatcat gtccttttcc cgttccacat cataggtggt ccctttatac cggctgtccg 18420
tcatttttaa atataggttt tcattttctc ccaccagctt atatacctta gcaggagaca 18480
ttccttccgt atcttttacg cagcggtatt tttcgatcag ttttttcaat tccggtgata 18540
ttctcatttt agccatttat tatttccttc ctcttttcta cagtatttaa agatacccca 18600
agaagctaat tataacaaga cgaactccaa ttcactgttc cttgcattct aaaaccttaa 18660
ataccagaaa acagcttttt caaagttgtt ttcaaagttg gcgtataaca tagtatcgac 18720
ggagccgatt ttgaaaccgc ggtgatcaca ggcagcaacg ctctgtcatc gttacaatca 18780
acatgctacc ctccgcgaga tcatccgtgt ttcaaacccg gcagcttagt tgccgttctt 18840
ccgaatagca tcggtaacat gagcaaagtc tgccgcctta caacggctct cccgctgacg 18900
ccgtcccgga ctgatgggct gcctgtatcg agtggtgatt ttgtgccgag ctgccggtcg 18960
gggagctgtt ggctggct 18978
<210>2
<211>1423
<212>PRT
<213>人工序列(Artificial Sequence)
<400>2
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr
1400 1405 1410
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1415 1420
<210>3
<211>208
<212>PRT
<213>人工序列(Artificial Sequence)
<400>3
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Trp Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
<210>4
<211>98
<212>PRT
<213>人工序列(Artificial Sequence)
<400>4
Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly
1 5 10 15
Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
20 25 30
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr
35 40 45
Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp
50 55 60
Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly
65 70 75 80
Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg
85 90 95
Lys Val
<210>5
<211>1026
<212>DNA
<213>人工序列(Artificial Sequence)
<400>5
atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 60
agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120
gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180
cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240
ggggagttta gcgagagcct gacctattgc atctcccgcc gttcacaggg tgtcacgttg 300
caagacctgc ctgaaaccga actgcccgct gttctacaac cggtcgcgga ggctatggat 360
gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420
atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480
cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540
ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600
tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660
atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720
tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgcca 780
cgactccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840
ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900
gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960
tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020
aaatag 1026
<210>6
<211>23
<212>DNA
<213>人工序列(Artificial Sequence)
<400>6
caccccccgc cgttcacagg ggg 23

Claims (9)

1.成套试剂,其包括sgRNA、C·T碱基替换***和功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料;
所述sgRNA由靶向目标基因靶点序列的sgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA组成;
所述sgRNA结构如下:所述靶点序列转录的RNA-sgRNA骨架;
所述sgRNA骨架为将序列1第571-646位中的T替换为U得到的RNA分子;
所述C·T碱基替换***包括Cas9核酸酶或与所述Cas9核酸酶相关的生物材料和胞嘧啶脱氨酶或与所述胞嘧啶脱氨酶相关的生物材料;
与所述Cas9核酸酶相关的生物材料为编码所述Cas9核酸酶的核酸分子或含有所述核酸分子的表达盒、重组载体、重组微生物、转基因细胞系;
与所述胞嘧啶脱氨酶相关的生物材料为编码所述胞嘧啶脱氨酶的核酸分子或含有所述核酸分子的表达盒、重组载体、重组微生物、转基因细胞系;
与所述功能丧失的筛选剂抗性基因相关的生物材料为编码所述功能丧失的筛选剂抗性基因的核酸分子或含有所述核酸分子的表达盒、重组载体、重组微生物、转基因细胞系;
所述功能丧失的筛选剂抗性基因为将筛选剂抗性基因进行无功能突变后得到的序列;
所述功能丧失的筛选剂抗性基因靶点序列为含有所述突变位点的靶点序列;
所述C·T碱基替换***在靶向所述含有所述突变位点的靶点序列的sgRNA的向导下,可通过对所述突变位点进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复;
所述功能丧失的筛选标记基因为将潮霉素抗性基因的第272位由T突变为C,且将第274位由T突变为C后得到的序列;所述潮霉素抗性基因序列为序列5;
所述功能丧失的筛选剂抗性基因靶点序列为序列1第11574-11596位。
2.根据权利要求1所述的成套试剂,其特征在于:所述sgRNA为tRNA-sgRNA;所述tRNA-sgRNA由靶向所述目标基因靶点序列的tRNA-sgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA组成;
所述tRNA-sgRNA结构如下:tRNA-所述靶点序列转录的RNA-sgRNA骨架;
所述tRNA为将序列1第474-550位中的T替换为U得到的RNA分子。
3.根据权利要求1所述的成套试剂,其特征在于:所述C·T碱基替换***还包括UGI或与所述UGI相关的生物材料;
所述Cas9核酸酶为SpCas9n蛋白质;
所述胞嘧啶脱氨酶为PmCDA1蛋白质;
所述SpCas9n蛋白质为序列2所示的蛋白质;
与所述SpCas9n相关的生物材料为B1)至B5)中的任一种:
B1)编码所述SpCas9n的核酸分子;
B2)含有B1)所述核酸分子的表达盒;
B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物;
B5)含有B1)所述核酸分子的转基因细胞系、或含有B2)所述表达盒的转基因细胞系;
所述PmCDA1蛋白质为序列3所示的蛋白质;
与所述PmCDA1蛋白质相关的生物材料为F1)至F5)中的任一种:
F1)编码所述PmCDA1蛋白质的核酸分子;
F2)含有F1)所述核酸分子的表达盒;
F3)含有F1)所述核酸分子的重组载体、或含有F2)所述表达盒的重组载体;
F4)含有F1)所述核酸分子的重组微生物、或含有F2)所述表达盒的重组微生物、或含有F3)所述重组载体的重组微生物;
F5)含有F1)所述核酸分子的转基因细胞系、或含有F2)所述表达盒的转基因细胞系;
所述UGI蛋白质为序列4所示的蛋白质;
与所述UGI蛋白质相关的生物材料为J1)至J5)中的任一种:
J1)编码所述UGI蛋白质的核酸分子;
J2)含有J1)所述核酸分子的表达盒;
J3)含有J1)所述核酸分子的重组载体、或含有J2)所述表达盒的重组载体;
J4)含有J1)所述核酸分子的重组微生物、或含有J2)所述表达盒的重组微生物、或含有J3)所述重组载体的重组微生物;
J5)含有J1)所述核酸分子的转基因细胞系、或含有J2)所述表达盒的转基因细胞系。
4.权利要求1-3任一所述的成套试剂在M1)-M6)任一种中的应用:
M1)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞;
M2)制备富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的产品;
M3)提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率;
M4)制备提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率的产品;
M5)生物体或生物细胞基因组靶点序列中的C·T碱基替换;
M6)制备生物体或生物细胞靶点序列中的C·T碱基替换的产品。
5.N1)或N2)或N3)或N4)或N5)所述的方法:
N1)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将权利要求1-3中任一所述的Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的sgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因、UGI的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内,使所述Cas9核酸酶、所述sgRNA、所述胞嘧啶脱氨酶和UGI均得到表达;所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N2)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将权利要求1-3中任一所述的Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的sgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内,使所述Cas9核酸酶、所述sgRNA、所述胞嘧啶脱氨酶均得到表达;所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N3)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将权利要求1-3中任一所述的Cas9核酸酶、靶向目标基因靶点序列的sgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶、UGI和功能丧失的筛选剂抗性基因导入生物体或生物细胞内;所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N4)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将权利要求1-3中任一所述的Cas9核酸酶、靶向目标基因靶点序列的sgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶和功能丧失的筛选剂抗性基因导入生物体或生物细胞内;所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N5)生物突变体的制备方法,包括如下步骤:按照N1)或N2)或N3)或N4)所述的方法对生物体的基因组进行编辑,获得生物突变体;所述生物突变体为发生C·T碱基替换的生物体。
6.根据权利要求4所述的应用或权利要求5所述的方法,其特征在于:所述生物体为植物或动物;所述生物细胞为植物细胞或动物细胞。
7.根据权利要求6所述的应用或方法,其特征在于:所述植物为单子叶植物或双子叶植物;所述植物细胞为单子叶植物细胞或双子叶植物细胞。
8.根据权利要求7所述的应用或方法,其特征在于:所述单子叶植物为禾本科植物;所述单子叶植物细胞为禾本科植物细胞。
9.根据权利要求8所述的应用或方法,其特征在于:所述禾本科植物为水稻;所述禾本科植物细胞为水稻细胞。
CN201910939081.4A 2019-09-30 2019-09-30 以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用 Active CN110669794B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910939081.4A CN110669794B (zh) 2019-09-30 2019-09-30 以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910939081.4A CN110669794B (zh) 2019-09-30 2019-09-30 以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用

Publications (2)

Publication Number Publication Date
CN110669794A CN110669794A (zh) 2020-01-10
CN110669794B true CN110669794B (zh) 2021-07-16

Family

ID=69080459

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910939081.4A Active CN110669794B (zh) 2019-09-30 2019-09-30 以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用

Country Status (1)

Country Link
CN (1) CN110669794B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114507683A (zh) * 2021-11-19 2022-05-17 杭州嘉因生物科技有限公司 一种敲除Kan抗性基因的SURE菌株及其构建方法和应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003090515A2 (en) * 2002-03-25 2003-11-06 Applera Corporation Systems and methods for detection of nuclear receptor function using reporter enzyme mutant complementation
CN108795972A (zh) * 2017-05-05 2018-11-13 中国科学院遗传与发育生物学研究所 不使用转基因标记序列分离细胞的方法
CN109456973A (zh) * 2018-12-28 2019-03-12 北京市农林科学院 SpCas9n&PmCDA1&UGI碱基编辑***在植物基因编辑中的应用
CN109652440A (zh) * 2018-12-28 2019-04-19 北京市农林科学院 VQRn-Cas9&PmCDA1&UGI碱基编辑***在植物基因编辑中的应用
CN109679989A (zh) * 2018-12-29 2019-04-26 北京市农林科学院 一种提高碱基编辑***编辑效率的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003090515A2 (en) * 2002-03-25 2003-11-06 Applera Corporation Systems and methods for detection of nuclear receptor function using reporter enzyme mutant complementation
CN108795972A (zh) * 2017-05-05 2018-11-13 中国科学院遗传与发育生物学研究所 不使用转基因标记序列分离细胞的方法
CN109456973A (zh) * 2018-12-28 2019-03-12 北京市农林科学院 SpCas9n&PmCDA1&UGI碱基编辑***在植物基因编辑中的应用
CN109652440A (zh) * 2018-12-28 2019-04-19 北京市农林科学院 VQRn-Cas9&PmCDA1&UGI碱基编辑***在植物基因编辑中的应用
CN109679989A (zh) * 2018-12-29 2019-04-26 北京市农林科学院 一种提高碱基编辑***编辑效率的方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
"A highly efficient method for enriching TALEN or CRISP R/Cas9-edited mutant cells";Hideyo Yasuda et al.;《Journal of Genetics and Genomics》;20161101;第43卷;第706页图1A *
"Boosting CRISPR/Cas9 multiplex editing capability with the endogenous tRNA-processing system";Kabin Xie et al.;《PNAS》;20150317;第112卷(第11期);第3570-3575页 *
"Discriminated sgRNAs-Based SurroGate System Greatly Enhances the Screening Efficiency of Plant Base-Edited Cells";Wen Xu et al.;《Molecular Plant》;20191018;第13卷;第169-180页 *
"Expanded base editing in rice and wheat using a Cas9-adenosine deaminase fusion";Chao Li et al.;《Genome Biology》;20180529;第19卷;第1-9页 *
"Surrogate reporter-based enrichment of cells containing RNA-guided Cas9 nuclease-induced mutations";Suresh Ramakrishna et al.;《NATURE COMMUNICATIONS》;20140226;第5卷;补充实验材料部分图6a *

Also Published As

Publication number Publication date
CN110669794A (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
CN108486146B (zh) LbCpf1-RR突变体用于CRISPR/Cpf1***在植物基因编辑中的应用
CN108997484B (zh) 小麦TaWox5基因在提高小麦转化效率中的应用
CN111534535B (zh) 一种构建麦角硫因生产菌的方法
Van Eck et al. Agrobacterium tumefaciens-mediated transformation of Setaria viridis
CN110669794B (zh) 以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用
CN109022285B (zh) 一种提高集胞藻pcc6803铵盐耐受能力的方法与应用
CN111154764B (zh) 一种通过基因组编辑提高水稻抗病性的方法及其使用的sgRNA
KR20230163460A (ko) 식물에서의 증가된 형질전환성 및 반수체 유도
CN114317598A (zh) 病毒诱导的基因沉默载体及其应用和柑橘病害防控的方法
CN108531502A (zh) 柑桔衰退病毒侵染性克隆的构建及接种方法
CN109456990B (zh) 一种利用基因组编辑技术提高叶绿体遗传转化效率的方法
CN112553246A (zh) 一种基于CRISPR-SaCas9***的高效基因组编辑载体及其应用
CN107384951A (zh) 一种谷氨酸棒状杆菌的基因编辑载体、制备方法、***及其应用
CN101709300B (zh) 水稻人工miRNA基因干涉载体快速构建方法
CN108559759A (zh) 三元穿梭载体及利用其构建clbv侵染性克隆的方法
CN110938650B (zh) 一种mRNA可变剪切-荧光素酶报告***及其应用
CN110724689B (zh) Cas9介导的麻竹基因编辑载体和应用
KR102170566B1 (ko) 목적 유전자의 발현을 조기 종결하기 위한 벡터 및 이를 포함하는 균주
CN109750059B (zh) 水稻β-淀粉酶BA2及其编码基因与应用
CN113174400B (zh) 一种自动删除选择标记的转基因方法
CN113166771A (zh) 基因治疗dna载体gdtt1.8nas12及用于获得它的方法
CN113490741A (zh) 通过天然miRNA的基因组编辑抑制靶基因表达
KR102399035B1 (ko) 산업 균주 내 온-타겟 효율의 감소 없이 오프-타겟이 없는 사이토신 염기 편집기를 발현하는 벡터 및 이의 용도
Sefasi et al. Transient expression of β-glucuronidase in recalcitrant ugandan sweetpotato and putative transformation with two cry genes
RU2715314C1 (ru) Генотерапевтический ДНК-вектор VTvaf17-Act1-Cas9 на основе генотерапевтического ДНК-вектора VTvaf17, несущий целевой ген Cas9, для гетерологичной экспрессии этого целевого гена в клетках растений при геномном редактировании растений, способ получения и применения генотерапевтического ДНК-вектора, штамм Escherichia coli SCS110-AF/VTvaf17-Act1-Cas9, несущий генотерапевтический ДНК-вектор, способ его получения, способ производства в промышленных масштабах генотерапевтического ДНК-вектора

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant