WO2024037338A1

WO2024037338A1 - 一种植株籽粒大小调控基因及其应用

Info

Publication number: WO2024037338A1
Application number: PCT/CN2023/110679
Authority: WO
Inventors: 马力耕; 曹颖; 吴静
Original assignee: 首都师范大学
Priority date: 2022-08-19
Filing date: 2023-08-02
Publication date: 2024-02-22
Also published as: CN117187256A

Abstract

公开了一种植株籽粒大小调控基因及其应用，属于生物技术领域。通过基因编辑的方式，获得不同作物中的PCFS基因突变体，并通过实验及统计分析发现所述突变体具有植株籽粒变大的表型，部分突变体具有耐胁迫能力提高的表型。所提供的基因、突变体及其应用方法，有助于提高作物产量和改善品质，增强植株对逆境的抗性，为培育具有大粒重、抗逆性强的植物新品种提供了基因资源和技术支持，对作物农艺性状的改良和高产、强抗逆性分子育种工作具有重要的意义和应用价值。

Description

一种植株籽粒大小调控基因及其应用

本申请要求于2022年8月19日提交中国专利局、优先权号为202210999291.4、发明名称为“一种植株籽粒大小调控基因及其应用”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明属于植物生物技术育种领域，具体涉及一种PCFS家族基因，及通过突变该基因来获得农艺性状改良植株的方法。

背景技术

人口持续增长与耕地面积不断减少的现状，对全球粮食安全提出了严峻的挑战。如何通过生物技术的手段，挖掘优质基因资源，应用于作物育种，从而获得高产量、高质量、利于机械化耕作的作物品种，是全人类的重要课题。

植物籽粒大小是农业生产中重点关注的性状，直接影响农作物的产量，水稻、小麦、玉米等主粮作物的籽粒变大可以提高粮食产量，油菜，大豆等油料作物的籽粒变大可以提高产油量，对于促进农业生产至关重要。此外，农作物在生长的过程中，常常受到恶劣的环境的影响，比如干旱、盐胁迫、病虫灾害等，因此，选取抗旱、抗盐、抗病虫害等抗性强的品种，可以有效提高植物的抗性和适应力，以达到高产的目的。对于油菜具有的分枝多且分枝上的果荚成熟晚，机器常常不能收获到侧枝上籽粒的问题，如何获得合理株型也是作物育种中十分关注的课题。由以上可知，不论是籽粒变大，分枝变少，还是对渗透胁迫的抗性增强，都是农业上的有利性状，对于提高作物产量、发展现代化农业非常重要。

PCFS(Pcf11-SIMILAR PROTEIN)同源基因最早报道是在酵母中，酵母中的基因名称为Pcf11(protein 1 of CF I)，使用酵母Pcf11的蛋白序列进行基因比对，可在植物中找到相关的同源蛋白。在高等植物中，PCFS家族一般有两个或两个以上的同源基因。在此之前，很少有人关注植物中PCFS家族的基因功能。本申请的发明人在探索PCFS家族的基因功能时，通过CRISPR/Cas9技术对拟南芥、油菜、玉米、大豆、水稻等植株的PCFS家族基因进行编辑，拿到突变体后，出乎意料的发现N端完整的PCFS家族基因的突变，可以调控植株的籽粒大小，使植株的籽粒变大变重，同时部分PCFS基因突变还有增强植株对逆境胁迫的耐受性、减少分枝数的功能。本申请实施例所提供的基因、突变体及其应用方法，有助于提高作物产量和改善品质，增强植株对逆境的抗性，为培育具有大粒重、抗逆性强的植物新品种提供了基因资源和技术支持，对作物农艺性状的改良和高产、强抗逆性分子育种工作具有重要的意义和应用价值。

发明内容

本文提到的所有参考文献都通过引用并入本文。除非有相反指明,本文所用的所有技术和科学术语都具有与本申请所属领域普通技术人员通常所理解的相同的含义。除非有相反指明,本文所使用的或提到的技术是本领域普通技术人员公知的标准技术。材料、方法和例子仅作阐述用,而非加以限制。

本申请实施例提供了一种基因及其突变体核苷酸序列，其特征在于，含有所述基因突变的植株，其籽粒变大，所述基因的核苷酸序列选自下列组的序列之一：

(a)拟南芥中基因号为AT2G36480或AT4G04885的核苷酸序列；

(b)油菜中基因号为BnaA04G0223600WE、BnaA05G0075100WE、BnaA09G0222400WE、BnaC04G0102200WE、BnaC04G0535800WE或BnaC09G0254600WE的核苷酸序列；

(c)大豆中基因号为Glyma.03G191200、Glyma.10G066300、Glyma.10G251100、Glyma.19G191800、Glyma.19G191900或Glyma.20G142500的核苷酸序列；

(d)水稻中基因号为LOC_Os08g08830或LOC_Os09g39270的核苷酸序列；

(e)玉米中基因号为Zm00001d000023、Zm00001d005350、Zm00001d019856或Zm00001d049442的核苷酸序列；

(f)在严谨条件下能够与(a)-(e)之任一所述核苷酸序列杂交的核苷酸序列；

(g)与(a)-(f)之任一所述核苷酸序列的全长至少有85％、90％、95％或以上序列相似性，且在植株中突变后具有使植株籽粒变大功能的核苷酸序列；或

(h)与(a)-(g)之任一所述核苷酸序列互补的核苷酸序列。

本申请实施例提供了一种基因及其突变体核苷酸序列，所述基因突变后具有植株籽粒变大和/或变重的表型，所述基因的核苷酸序列选自下列组的序列之一：

(a)如SEQ ID NO：4、5、7、8、13、14、16、17、22、23、25、26、28、29、34、35、37、38、40、42、43、44、49、50、52、53、55、56、58、59、61、62、64、65、67、68、70、71、73或74所示的核苷酸序列；

(b)其编码氨基酸序列如SEQ ID NO：6、9、15、18、24、27、30、36、39、42、45、51、54、57、60、63、66、69、72或75所示的核苷酸序列；

(c)在严谨条件下能够与(a)或(b)中所述序列杂交的核苷酸序列；

(d)与(a)-(c)之任一所述核苷酸序列的全长至少有85％、90％、95％或以上序列相似性，且突变后具有使植株籽粒变大和/或变重功能的核苷酸序列；或

(e)与(a)-(d)之任一所述序列互补的核苷酸序列。

本申请实施例中提供的上述基因可从各种植物中分离获得。本领域技术人员应该知晓，本申请所述的基因还包括与该基因的核苷酸序列或蛋白序列高度同源，并且突变后具有同样的籽粒变大和/或变重功能的同源基因。所述同源基因包括在严谨条件下能够与本申请实施例所公开的基因的核苷酸序列杂交的DNA序列。本文中使用的“严谨条件”是公知的，包括诸如在含400mM NaCl、40mM PIPES(pH6.4)和1mM EDTA的杂交液中杂交，所述杂交的温度优选是53℃-60℃，杂交时间优选为12-16小时，然后用含0.5×SSC和0.1％SDS的洗涤液洗涤，洗涤温度优选为62℃-68℃，洗涤时间为15-60分钟。

同源基因还包括与本申请实施例所公开的基因所示的DNA序列有至少80％、85％、90％、95％、98％、99％或更高序列相似性，或者与本申请实施例所公开的功能基因的氨基酸序列有至少80％、85％、90％、95％、98％、99％或更高序列相似性，且突变后具有使植株籽粒变大和/或变重功能的DNA序列，可以从任何植物中分离获得。更具体地，所述PCFS家族基因DNA序列编码的蛋白氨基酸序列具有完整的N端，所述N端的氨基酸序列为Y...L_XELT_XN_XKP_XIT_XLTI_XA...E...Q_XLP_XLYLLDSIVKN_XG_XXY...F_...L_XXVF_XXAY...M_XXLF_XTW_XXVF...L_XXI...L...IH(_X代表任一氨基酸，...代表超过任意三个随机氨基酸序列，其余字母代表特定氨基酸)。其中，序列相似性的百分比可以通过公知的生物信息学算法来获得，包括Myers和Miller算法、Needleman-Wunsch全局比对法、Smith-Waterman局部比对法、Pearson和Lipman相似性搜索法、Karlin和Altschul的算法，这对于本领域技术人员来说是公知的。

本领域技术人员应该知晓，同一种植物不同品种间的同一基因存在单核苷酸多样性(single nucleotide polymorphism,SNP)，即同一基因的核苷酸序列往往存在个别碱基的差异，但同一作物品种数量很多，发明人不可能进行一一列举，本申请仅提供了不同作物中具有代表性的品种的序列。因此，本领域技术人员应该知悉，不同品种来源的与本申请所保护基因及其核苷酸序列存在SNP的核苷酸序列也在本申请的保护范围内。

本申请实施例所述的突变是指在本申请基因的核苷酸序列上进行取代、缺失和/或添加一个或多个核苷酸获得，所述基因突变后具有改善农艺性状的功能，包括使植株籽粒变重和/或变大，其中pcfs4(基因编号为AT4G04885，核苷酸序列如SEQ ID NO:7或8所示)单基因突变或是pcfs2和pcfs4双突之后，还具有增加耐逆性和/或减少分枝数等的调控功能。本申请实施例所述的突变可以是点突变，也可以是DNA缺失或***突变。所述突变可以通过物理诱变、化学诱变或基因编辑的方式获得,化学诱变的方法包括用EMS等诱变剂处理所导致的诱变；基因编辑的方法包括但不限于ZFN、TALEN和/或CRISPR/Cas9等基因编辑方法。

更具体地，在通过CRISPR/Cas9基因编辑方法获得本申请实施例中基因突变体核苷酸序列时，所述CRISPR/Cas9基因编辑方法所用的靶点序列选自下列组的序列之一:

(a)序列为SEQ ID NO：4、5、7、8、13、14、16、17、22、23、25、26、28、29、34、35、37、38、40、42、43、44、49、50、52、53、55、56、58、59、61、62、64、65、67、68、70、71、73或74所示核苷酸序列中符合5’-Nx-NGG-3’序列排列规则的片段，其中N表示A、G、C和T中的任一种,14<X<30,且X为整数,Nx表示X个连续的核苷酸；或

(b)与(a)所述的多核苷酸互补的多核苷酸。

更具体地，在使用CRISPR/Cas9技术进行基因编辑时，针对拟南芥植株的靶点序列如SEQ ID NO:76-79之任一所示，针对油菜植株的靶点序列如SEQ ID NO:80-83之任一所示，针对大豆植株的靶点序列如SEQ ID NO:84-87之任一所示，针对水稻植株的靶点序列如SEQ ID NO:88-91之任一所示，针对玉米植株的靶点序列如SEQ ID NO:92-95之任一所示。

根据本申请实施例所述的基因突变体核苷酸序列，其特征在于，所述基因突变体的核苷酸序列如SEQ ID NO:97、98、100-105之任一所示。

本申请实施例还公开了一种调控植株农艺性状的方法，其特征在于通过突变植株的下述基因，使植株籽粒变大变重，所述基因的核苷酸序列选自下列组的序列之一：

(a)拟南芥中基因号为AT2G36480或AT4G04885的核苷酸序列；

(d)水稻中基因号为LOC_Os08g08830或LOC_Os09g39270的核苷酸序列；或玉米中基因号为Zm00001d000023、Zm00001d005350、Zm00001d019856或Zm00001d049442的核苷酸序列；

(e)在严谨条件下能够与(a)-(e)之任一所述核苷酸序列杂交的DNA序列；或

(f)与(a)-(f)之任一所述核苷酸序列的全长至少有85％、90％、95％或以上序列相似性，且在植株中突变后具有使植株籽粒变大功能的核苷酸序列；或

(g)与(a)-(f)之任一所述核苷酸序列互补的DNA序列。

具体地，本申请实施例所公开的调控植株农艺性状的方法，其特征在于通过突变植株的下述基因，使植株籽粒变大和/或变重，所述基因的核苷酸序列选自下列组的序列之一：

(d)与(a)-(c)之任一所述核苷酸序列的全长至少有85％、90％、95％或以上序列相似性，且在植株中突变后具有使植株籽粒变大功能的核苷酸序列；或

(e)与(a)-(d)之任一所述序列互补的DNA序列。

本申请实施例中提供的调控植株农艺性状的方法，其中所述的基因可从各种植物中分离获得。本领域技术人员应该知晓，本申请所述的调控植株农艺性状的方法中，所使用的基因还包括与该基因的核苷酸序列或蛋白序列高度同源，并且突变后具有同样的籽粒变大变重功能的同源基因。所述同源基因包括在严谨条件下能够与本申请实施例所公开的基因的核苷酸序列杂交的DNA序列。本文中使用的“严谨条件”是公知的，包括诸如在含400mM NaCl、40mM PIPES(pH6.4)和1mM EDTA的杂交液中杂交，所述杂交的温度优选是53℃-60℃，杂交时间优选为12-16小时，然后用含0.5×SSC和0.1％SDS的洗涤液洗涤，洗涤温度优选为62℃-68℃，洗涤时间为15-60分钟。

同源基因还包括与本申请实施例所公开的PCFS家族基因所示的DNA序列有至少80％、85％、90％、95％、98％或99％序列相似性，且突变后具有同样的籽粒变大和/或变重功能的DNA序列，可以从任何植物中分离获得。更具体地，所述PCFS家族基因DNA序列编码的蛋白氨基酸序列具有完整的N端，所述N端的氨基酸序列为Y...L_XELT_XN_XKP_XIT_XLTI_XA...E...Q_XLP_XLYLLDSIVKN_XG_XXY...F_...L_XXVF_XXAY...M_XXLF_XTW_XXVF...L_XXI...L...IH(_X代表任一氨基酸，...代表超过任意三个随机氨基酸序列，其余字母代表特定氨基酸)。其中，序列相似性的百分比可以通过公知的生物信息学算法来获得，包括Myers和Miller算法、Needleman-Wunsch全局比对法、Smith-Waterman局部比对法、Pearson和Lipman相似性搜索法、Karlin和Altschul的算法，这对于本领域技术人员来说是公知的。

本申请实施例所述调控植株农艺性状的方法中，其中所述的突变是指在本申请所披露基因的核苷酸序列上进行取代、缺失和/或添加一个或多个核苷酸获得，所述基因突变后具有改善农艺性状的功能，包括使植株籽粒变重和/或变大，其中pcfs4(基因号为AT4G04885，核苷酸序列如SEQ ID NO:7或8所示)单基因突变或是pcfs2和pcfs4双基因突变之后，还具有增加耐逆性和/或减少分枝数等的调控功能。本申请实施例所述的突变可以是点突变，也可以是DNA缺失或***突变。所述突变可以通过物理诱变、化学诱变或基因编辑的方式获得,化学诱变的方法包括用EMS等诱变剂处理所导致的诱变；基因编辑的方法包括但不限于ZFN、TALEN和/或CRISPR/Cas9等基因编辑方法。

更具体地，在使用CRISPR/Cas9技术进行植株农艺性状调控时，所用的靶点序列选自下列组的任一序列之一:

(b)与(a)所述的多核苷酸互补的多核苷酸。

本申请实施例还公开了一种非作为繁殖材料的植物细胞、组织、器官或产品，其特征在于，所述植物细胞、组织、器官或产品含有本申请前述任一所述的基因突变体核苷酸序列。

本申请实施例还公开了前述任一所述的方法、及其获得的突变体材料在育种中的应用。具体地，所述在育种中的应用是指通过基因突变的方式，或是通过与本申请基因突变体材料杂交的方式，获得该基因突变体，使植株呈现籽粒变重和/或变大的表型。

与相关技术相比,本申请具有如下有益效果:

1)本申请提供了一种植株籽粒大小调控基因,该基因属于PCFS家族基因，该基因编码的蛋白氨基酸序列的N端具有保守结构域，该结构域的序列为Y...L_XELT_XN_XKP_XIT_XLTI_XA...E...Q_XLP_XLYLLDSIVKN_XG_XXY...F_...L_XXVF_XXAY...M_XXLF_XTW_XXVF...L_XXI...L...IH(_X代表任一氨基酸，...代表超过任意三个随机氨基酸序列，其余字母代表特定氨基酸)。

2)本申请所提供的PCFS基因突变后可使植株的籽粒变大,从而增加植株的产量,为作物的高产育种提供了新的基因资源。

3)本申请提供的PCFS家族基因可以作为控制作物籽粒大小、提高产量和品质的一个基因,应用于作物品种的改良,有助于选育出优质性状的作物新品种。同时,本申请基因还可用于分子标记技术,为作物大粒高产育种等实际生产应用服务。

4)本申请提供的PCFS基因在拟南芥、油菜、大豆、玉米、水稻等众多植物中具有同源基因,不仅可以用于前述植物的育种,还可用于其它植物的新品种培育。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，其中:

图1是基因编辑载体图。其中U6promoter表示U6启动子，U6terminal表示终止子，target表示基因编辑靶点。

图2是拟南芥基因编辑突变体的PCR检测结果。

图3是拟南芥PCFS家族基因不同突变体的分枝表型及统计结果。图3A为生长50天的野生型及突变体分枝数量图片，图3B为分枝数量量化统计图，横坐标是野生型及各个突变体，纵坐标为不同植株分枝个数的比例。

图4是拟南芥PCFS家族基因不同突变体籽粒表型及千粒重统计结果。图4A为野生型及突变体成熟后的籽粒在解剖镜下所拍的图片，图4B为千粒重的量化统计图，横坐标是野生型及各个突变体，纵坐标为籽粒的千粒重，差异显著分析显示突变体与野生型极显著。

图5是拟南芥PCFS家族基因不同突变体在300mM甘露醇处理下的表型及统计结果。图5A为在正常培养基下生长6天后移到300mM甘露醇培养基上生长8天后的表型图，图5B为子叶变黄的量化统计图，横坐标是野生型及各个突变体，纵坐标是不同植株子叶颜色的比例。

图6是不同作物PCFS家族基因突变后的籽粒表型。图6A是油菜野生型与其pcfs突变体的籽粒大小对比图；图6B是野生型大豆与其pcfs突变体的籽粒大小对比图；图6C是水稻野生型与其pcfs突变体的籽粒脱壳后的大小对比图；图6D是野生型玉米与其pcfs突变体的籽粒大小对比图。WT表示野生型，mutant表示突变体。

图7是不同作物PCFS家族基因突变后的籽粒千粒重统计。图7A是油菜野生型与其pcfs突变体的籽粒千粒重统计结果；图7B是大豆野生型与其pcfs突变体的籽粒百粒重统计结果；图7C是水稻野生型与其pcfs突变体的籽粒千粒重统计结果；图7D是玉米野生型与其pcfs突变体的籽粒百粒重统计结果。

具体实施方式

以下实施例用于说明本申请,但不用来限制本申请的范围。在不背离本申请精神和实质的情况下,对本申请方法、步骤或条件所作的修改或替换,均属于本申请的范围。若未特别指明,实施例中所用的材料、生物化学试剂均为常规市售试剂,实施例中所用的技术手段为本领域技术人员熟知常规手段。

实施例1、构建拟南芥PCFS突变体植物

为了研究植物中PCFS家族基因的功能，利用酵母Pcf11的蛋白序列，在Phytozome网站上比对拟南芥中的同源蛋白(进入网站后点击Tools，点击BLAST，输入酵母Pcf11的蛋白序列，选择物种Arabidopsis thaliana，点击go)，拟南芥中的同源蛋白共有4个，分别为PCFS1、PCFS2、PCFS4和PCFS5。在TAIR网站上分别下载相应的基因序列、CDS序列和蛋白序列。其中PCFS1、PCFS2、PCFS4和PCFS5对应的基因号依次分别为AT1G66500、AT2G36480、AT4G04885、AT5G43620，其基因组DNA序列依次分别如SEQ ID NO:1、4、7、10所示,其CDS(编码区序列)序列依次分别如SEQ ID NO:2、5、8、11所示，其蛋白氨基酸序列依次分别如SEQ ID NO:3、6、9、12所示。

发明人拟通过CRISPR/Cas9基因编辑的方式获得上述基因的拟南芥突变体。先利用CRISPR-P V2.0网站预测基因编辑的高效靶点(进入网站后PAM默认，snoRNA promoter选U6，guide sequence length选19，输入Arabidopsis thaliana、基因号或者基因序列，点击submit)，在给出的预测靶点中选取分高且靶点位于外显子上的靶点，这样的靶点编辑高效，其目的是构建突变体植株。本实施例一共选取了4个靶点靶向四个PCFS家族基因，4个靶点的具体信息如表1所示。将这4个靶点一起构建到PHEE401E载体(该载体购买自addgene(https://www.addgene.org/)，该载体信息参考文章：Wang ZP,Xing HL,Dong L,et al.Egg cell-specific promoter-controlled CRISPR/Cas9 efficiently generates homozygous mutants for multiple target genes in Arabidopsis in a single generation.Genome Biol.2015；16(1):144.)，转化到大肠杆菌和农杆菌中，利用农杆菌浸花法将载体转化到Col-0背景的野生型拟南芥中。

具体地，将所述靶点构建到基因编辑载体的方法如下：

1)针对下表1中的拟南芥PCFS家族的四个基因，选择四个靶点，人工合成4条核苷酸产物，如下表2所示，4条核苷酸产物分别包含四个靶点信息，其核苷酸序列分别如SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、SEQ ID NO:109所示，其中靶点在表2中用下划线标注。

2)基因编辑载体上有2个BsaⅠ酶切位点，可用BsaⅠ内切酶酶切，使用表3的酶切连接体系及条件，由于载体和4条基因合成片段的5’端有未配对的核苷酸片段，利用T4连接酶，根据碱基互补配对的原则可以将4条基因合成片段按照特定的顺序连入载体。

表1：拟南芥中PCFS家族信息列表

表2：基因合成片段

表3：酶切连接体系及条件

基因编辑载体在植物中具有潮霉素抗性基因，收回转基因植株的籽粒，即转基因T₁代，将其铺在有潮霉素的植物培养基上，能正常生长的为转基因成功的植株。取一小片转基因成功植物的叶片，提取DNA，利用下表4中的引物对PCFS家族基因进行PCR特异扩增，在对PCR扩增产物进行电泳时，琼脂糖凝胶上表现为位置不同于野生型的条带的植株为本申请所预期的突变体植株，具体电泳结果如图2所示。

表4：鉴定拟南芥突变体引物

将获得的转基因T₁代突变体植株与野生型杂交，因为转基因位点是杂合，所以获得的杂交F₁代植株部分含有转基因***，部分不含有。利用下表5中的引物对转基因载体上的Cas基因进行PCR特异扩增，根据条带的有无判断载体是否被筛出。没有扩增条带的为载体被筛掉的植株，此时植株的PCFS基因为杂合状态，再自交1代则可以获得载体被筛掉的pcfs相关突变体。

表5：鉴定载体是否筛出植物体外引物

通过以上实验，获得了PCFS家族的相关突变体，分别命名为pcfs1，pcfs2，pcfs4，pcfs5。pcfs1为PCFS1的DNA序列上178-886位核苷酸序列缺失，其突变后的基因核苷酸序列如SEQ ID NO:96所示，该突变导致编码蛋白的第60位氨基酸开始发生改变，在64位碰到终止密码子。pcfs2为PCFS2的DNA序列上104-293位核苷酸序列缺失，同时***6bp核苷酸，其突变后的基因核苷酸序列如SEQ ID NO:97所示，该突变导致编码蛋白的第35位氨基酸开始发生改变，在46位碰到终止密码子。pcfs4为PCFS4的DNA序列上867-918位核苷酸序列缺失，其突变后的基因核苷酸序列如SEQ ID NO:98所示，该突变导致编码蛋白的第206位氨基酸开始发生改变，在210位碰到终止密码子。pcfs5为PCFS5的DNA序列上178-886位核苷酸序列缺失，其突变后的基因核苷酸序列如SEQ ID NO:99所示，该突变导致编码蛋白的第60位氨基酸开始发生改变，在64位碰到终止密码子。前述结果说明所述突变影响了所述基因蛋白的正常表达，使得其表达的蛋白多肽变短，抑制了蛋白的正常功能。

实施例2、观察拟南芥分枝表型及籽粒大小的表型

将同批次收到的野生型和突变体籽粒分别用15％的次氯酸钠溶液消毒10分钟，用灭过菌的双蒸水洗2遍，然后点在1/2MS植物培养基上，放进光照培养箱，在长日照(16小时光照21℃/8小时黑暗19℃)的条件下生长2周，然后将萌发的幼苗移到土里，放进温室，培养条件不变，2天浇一次水。

等到拟南芥抽薹后3个星期，株型完全确定，统计分枝数目。由图3可知，pcfs2突变体的分枝个数相比于野生型没有明显变化，而pcfs4突变体的分枝个数相比于野生型是减少的，双突的表型与pcfs4相似。本实验说明pcfs4基因突变还有减少植株分枝数的功能。

等到拟南芥籽粒完全黄透后收获籽粒，利用干燥球干燥两天后，在显微镜下观察籽粒大小及利用千分之一天平称量千粒重。由图4A可知，pcfs2、pcfs4及pcfs2pcfs4双突突变体的籽粒都比野生型的籽粒大。由图4B可知，pcfs2和pcfs4的千粒重相比野生型也都是增加的，增加的幅度分别为21％和22％，双突的籽粒变大表型加剧，千粒重提高了70％。

与此相比，pcfs1和pcfs5的突变体，二者都没有籽粒变大变重、或是分枝数变少的表型。

实施例3、观察拟南芥抗逆表型

将同批次收到的野生型和突变体籽粒用15％的次氯酸钠溶液消毒10分钟，用灭过菌的双蒸水洗2遍，然后点在竖直1/2MS植物培养基上，放进光照培养箱，在全日照(24小时光照21℃)的条件下生长6天，而后转到含有300mM甘露醇(模拟渗透胁迫，强度约为-1.0MPa)的水平1/2MS植物培养基上生长8天，统计子叶变黄的比例。由图5可知，pcfs2的抗性相对野生型没有明显差异，而pcfs4的存活率明显提高，同时pcfs2pcfs4双突的存活率大幅度提升。本实验说明pcfs4基因突变还具有耐胁迫的功能，而pcfs2和pcfs4同时突变的植株，由于其功能冗余，具有更强的耐胁迫性。

实施例4、不同作物中PCFS家族同源序列比对

由不同植物PCFS家族成员的氨基酸序列比对的结果可以知道，拟南芥，油菜，大豆，玉米，水稻等植物PCFS家族成员的C端的锌指结构域保守，拥有L...C_XXC...E...H...E_XQ_XXC_XLC_XE...W...I_XH_XXC(_X代表任一氨基酸，...代表超过任意三个随机氨基酸序列，其余字母代表特定氨基酸)保守结构域，(以上序列在给出的植物物种中100％匹配)。运用SMART网站(http://smart.embl-heidelberg.de/)和InterProScan网站(http://www.ebi.ac.uk/interpro/search/sequence/)都可以预测到以上所提物种的锌指结构域。部分PCFS家族成员缺失N端，但拥有完整N端的成员的N端也是保守的，N端的氨基酸序列为Y...L_XELT_XN_XKP_XIT_XLTI_XA...E...Q_XLP_XLYLLDSIVKN_XG_XXY...F_...L_XXVF_XXAY...M_XXLF_XTW_XXVF...L_XXI...L...IH(以上序列在给出的N端完整植物物种中100％匹配)。

通过拟南芥的前述实验结果及基因序列的结构分析，发现PCFS2和PCFS4拥有N端保守序列，其突变后表现出籽粒变大的表型；PCFS1和PCFS5缺失N端，其突变后和野生型相比没有明显差异。因此，在油菜、大豆、玉米、水稻等作物中的基因编辑，发明人优先选择敲除拥有完整N端的PCFS家族成员。

实施例5、构建油菜PCFS突变体植物

拟南芥和油菜都是十字花科的植物，利用拟南芥PCFS家族的蛋白序列，在BnTIR(http://yanglab.hzau.edu.cn/BnTIR/download)网站上比对油菜中的同源蛋白(进入网站后点击Tools，然后点击Blast，按照提示输入拟南芥PCFS家族基因名称就能得到在油菜中的同源序列)，甘蓝型油菜是异源二倍体，共有8个PCFS家族同源蛋白，其中6个拥有完整的N端，分别为BnaA04G0223600WE、BnaA05G0075100WE、BnaA09G0222400WE、BnaC04G0102200WE、BnaC04G0535800WE和BnaC09G0254600WE，其基因组DNA序列依次分别如SEQ ID NO:13、16、22、25、28、34所示，其CDS序列依次分别如SEQ ID NO:14、17、23、26、29、35所示，其蛋白氨基酸序列依次分别如SEQ ID NO:15、18、24、27、30、36所示。

发明人利用基因中的高度同源序列设计4个靶点靶向这6个基因，其靶点序列及其对应的序列编号如下表6所示。经转基因筛选，获得了BnaA05G0075100WE和BnaA09G0222400WE的双突突变体。该突变体的BnaA09G0222400WE基因的DNA序列的108-109位核苷酸位点缺失，其突变后的基因核苷酸序列如SEQ ID NO:100所示，所述突变导致蛋白序列在37位氨基酸开始发生改变，在78位氨基酸碰到终止密码子，同时BnaC09G0254600WE基因的DNA序列的110位***1个核苷酸，其突变后的基因核苷酸序列如SEQ ID NO:101所示，该突变导致蛋白序列在37位氨基酸开始发生改变，在42位氨基酸碰到终止密码子，说明所述突变影响了所述基因蛋白的正常表达，使得其表达的蛋白多肽变短，抑制了蛋白的正常功能。对野生型和突变体的籽粒大小进行观察，发现突变体具有籽粒变大的表型(如图6A所示)，相比野生型的千粒重提高了20％(如图7A所示)。

表6：油菜中PCFS家族信息列表

实施例6、分别构建大豆、玉米、水稻PCFS突变体植物

大豆、玉米、水稻中的PCFS家族同源基因的基因编号分别如下表7所示。其中大豆中N端完整的基因编号分别为Glyma.03G191200、Glyma.10G066300、Glyma.10G251100、Glyma.19G191800、Glyma.19G191900、Glyma.20G142500，其基因序列、CDS序列和蛋白序列获取自网站SoyBase(https://www.soybase.org/)。其基因组DNA序列依次分别如SEQ ID NO:37、40、43、49、52和55所示，其CDS序列分别依次如38、41、44、50、53和56所示，其蛋白氨基酸序列依次分别如SEQ ID NO:39、42、45、51、54和57所示。本申请针对大豆中的PCFS家族同源基因设计的基因编辑靶位点分别如SEQ ID NO:84-87所示(表7)。

水稻中的PCFS家族同源基因分别为LOC_Os08g08830和LOC_Os09g39270，其基因序列、CDS序列和蛋白序列获取网站Phytozome(https://phytozome-next.jgi.doe.gov/)。其基因组DNA序列分别如SEQ ID NO：58、61所示，其CDS序列分别如SEQ ID NO:59、62所示，其蛋白氨基酸序列分别如SEQ ID NO:60、63所示。本申请针对水稻PCFS家族同源基因设计的基因编辑靶位点分别如SEQ ID NO:88-91所示(表7)。

玉米中的PCFS家族同源基因分别为Zm00001d000023、Zm00001d005350、Zm00001d019856、Zm00001d049442，其基因序列、CDS序列和蛋白序列获取网站Phytozome(https://phytozome-next.jgi.doe.gov/)。其基因组DNA序列分别如SEQ ID NO:64、67、70、73所示，其CDS序列依次分别如SEQ ID NO:65、68、71、74所示，其蛋白氨基酸序列依次分别如SEQ ID NO:66、69、72、75所示。本申请针对玉米PCFS家族同源基因设计的基因编辑靶位点分别如SEQ ID NO:92-95所示(表7)。

表7：作物中PCFS家族信息列表

经过转基因筛选，获得了上述作物的突变体植株。在大豆中获得Glyma.10G251100基因发生突变的突变体，该突变体的DNA序列上193位核苷酸缺失，突变后的基因核苷酸序列如SEQ ID NO:102所示，该突变导致蛋白序列在65位氨基酸开始发生改变，在80位氨基酸碰到终止密码子；在水稻中获得LOC_Os08g08830基因发生突变的突变体，该突变体的DNA序列上203-4604位核苷酸缺失，其突变后的基因核苷酸序列如SEQ ID NO:103所示，该突变导致蛋白序列上71-449位氨基酸缺失；在玉米中获得Zm00001d000023和Zm00001d049442同时发生突变的突变体，该突变体的Zm00001d000023基因的DNA序列的1318-1609位核苷酸位点缺失，该突变后的基因核苷酸序列如SEQ ID NO:104所示，该突变导致蛋白序列在103位氨基酸开始发生改变，在126位氨基酸碰到终止密码子，同时Zm00001d049442基因的DNA序列的1789-2081位核苷酸位点缺失，该突变后的基因核苷酸序列如SEQ ID NO:105所示，导致蛋白序列在103位氨基酸开始发生改变，在116位氨基酸碰到终止密码子。前述实验结果表明，通过突变的方式使得本申请基因蛋白的表达受到了影响，包括表达的蛋白多肽变短，从而抑制了本申请基因蛋白的正常功能。

不同作物的籽粒表型及其千粒重或百粒重统计结果如图6和图7所示。从图中可以看出，N端完整的PCFS家族基因在油菜、水稻、大豆、玉米等作物中具有调控籽粒大小的功能的，在油菜和玉米中，N端完整的PCFS家族基因突变后籽粒变大，其千/百粒重提高了20％左右；在水稻和大豆中，N端完整的PCFS家族基因突变后其籽粒也变大，千/百粒重提高了10％左右。本实施例进一步证明了N端完整的PCFS家族基因具有植株籽粒大小调控的功能，通过突变等技术手段抑制该基因蛋白的正常功能后，可以使植株的籽粒变大，从而获得高产的作物品种。本领域技术人员应该知晓，本申请所述的抑制该基因蛋白的正常功能，包括通过突变的方式影响基因蛋白的正常功能，也包括通过影响所述基因蛋白的调控因子，从而抑制本申请N端完整的PCFS家族基因的正常功能，获得植株籽粒变大的表型。虽然，上文中已经用一般性说明、具体实施方式及试验，对本申请实施例作了详尽的描述，但在本申请基础上，可以对之作一些修改或改进，这对本领域技术人员而言是显而易见的。因此，在不偏离本申请精神的基础上所做的这些修改或改进，均属于本申请要求保护的范围。

Claims

一种基因突变体核苷酸序列，含有该基因突变的植株籽粒变大，所述基因的核苷酸序列选自下列组的序列之一：

(a)油菜中基因号为BnaA04G0223600WE、BnaA05G0075100WE、BnaA09G0222400WE、BnaC04G0102200WE、BnaC04G0535800WE或BnaC09G0254600WE的核苷酸序列；

(b)大豆中基因号为Glyma.03G191200、Glyma.10G066300、Glyma.10G251100、Glyma.19G191800、Glyma.19G191900或Glyma.20G142500的核苷酸序列；

(c)水稻中基因号为LOC_Os08g08830或LOC_Os09g39270的核苷酸序列；或

(d)玉米中基因号为Zm00001d000023、Zm00001d005350、Zm00001d019856或Zm00001d049442的核苷酸序列；或

(e)拟南芥中基因号为AT2G36480或AT4G04885的核苷酸序列；

(f)在严谨条件下能够与(a)-(e)之任一所述核苷酸序列杂交的核苷酸序列；

(g)与(a)-(f)之任一所述核苷酸序列的全长至少有85％、90％、95％或以上序列相似性，且在植株中突变后具有使植株籽粒变大功能的核苷酸序列；或

(h)与(a)-(g)之任一所述核苷酸序列互补的核苷酸序列。
根据权利要求1所述的基因突变体核苷酸序列，其中所述的基因的核苷酸序列选自下列组的序列之一：

(a)如SEQ ID NO：13、14、16、17、22、23、25、26、28、29、34、35、37、38、40、42、43、44、49、50、52、53、55、56、58、59、61、62、64、65、67、68、70、71、73、74、4、5、7或8所示的核苷酸序列；

(b)其编码氨基酸序列如SEQ ID NO：15、18、24、27、30、36、39、42、45、51、54、57、60、63、66、69、72、75、6或9所示的核苷酸序列；

(c)在严谨条件下能够与(a)或(b)中所述核苷酸序列杂交的DNA序列；

(d)与(a)-(c)之任一所述核苷酸序列的全长至少有85％、90％、95％或以上序列相似性，且突变后具有使植株籽粒变大功能的核苷酸序列；或

(e)与(a)-(d)之任一所述序列互补的DNA序列。
根据权利要求1或2所述的基因突变体核苷酸序列，所述的基因突变包括在该基因的核苷酸序列上进行取代、缺失和/或添加一个或多个核苷酸。
根据权利要求1-3之任一所述的基因突变体核苷酸序列，所述的突变通过物理诱变、化学诱变、ZFN、TALEN或CRISPR/Cas9等技术获得。
根据权利要求4所述的基因突变体核苷酸序列，其中所述的CRISPR/Cas9技术所用的靶点序列选自下列组的序列之一:

(a)序列为SEQ ID NO：4、5、7、8、13、14、16、17、22、23、25、26、28、29、34、35、37、38、40、42、43、44、49、50、52、53、55、56、58、59、61、62、64、65、67、68、70、71、73或74所示核苷酸序列中符合5’-Nx-NGG-3’序列排列规则的片段，其中N表示A、G、C和T中的任一种,14<X<30,且X为整数,Nx表示X个连续的核苷酸；或

(b)与(a)所述的多核苷酸互补的多核苷酸。
根据权利要求5所述的基因突变体核苷酸序列，其中所述的CRISPR/Cas9技术所用的靶点序列如SEQ ID NO:76-79、80-95之任一所示的序列。
根据权利要求1-6之任一所述的基因突变体核苷酸序列，所述基因突变体的核苷酸序列如SEQ ID NO:97、98、100-105之任一所示。
一种调控植株农艺性状的方法，通过突变植株的PCFS家族基因，使植株籽粒变大，所述基因的核苷酸序列选自下列组的序列之一：

(a)油菜中基因号为BnaA04G0223600WE、BnaA05G0075100WE、BnaA09G0222400WE、BnaC04G0102200WE、BnaC04G0535800WE或BnaC09G0254600WE的核苷酸序列；

(b)大豆中基因号为Glyma.03G191200、Glyma.10G066300、Glyma.10G251100、Glyma.19G191800、Glyma.19G191900或Glyma.20G142500的核苷酸序列；

(c)水稻中基因号为LOC_Os08g08830或LOC_Os09g39270的核苷酸序列；或

(d)玉米中基因位置号为Zm00001d000023、Zm00001d005350、Zm00001d019856 或Zm00001d049442的核苷酸序列；

(e)拟南芥中基因号为AT2G36480或AT4G04885的核苷酸序列；

(f)在严谨条件下能够与(a)-(e)之任一所述核苷酸序列杂交的DNA序列；

(g)与(a)-(f)之任一所述核苷酸序列的全长至少有85％、90％、95％或以上序列相似性，且在植株中突变后具有使植株籽粒变大功能的核苷酸序列；或

(h)与(a)-(g)之任一所述核苷酸序列互补的DNA序列。
根据权利要求8所述的方法，所述基因的核苷酸序列选自下列组的序列之一：

(a)如SEQ ID NO：13、14、16、17、22、23、25、26、28、29、34、35、37、38、40、42、43、44、49、50、52、53、55、56、58、59、61、62、64、65、67、68、70、71、73、74、4、5、7或8所示的核苷酸序列；

(b)其编码氨基酸序列如SEQ ID NO：15、18、24、27、30、36、39、42、45、51、54、57、60、63、66、69、72、75、6或9所示的核苷酸序列；

(c)在严谨条件下能够与(a)或(b)中所述序列杂交的DNA序列；或

(d)与(a)-(c)之任一所述核苷酸序列的全长至少有85％、90％、95％或以上序列相似性，且突变后具有使植株籽粒变大功能的核苷酸序列；

(e)与(a)-(d)之任一所述序列互补的DNA序列。
根据权利要求8或9所述的方法，所述基因的突变包括在该基因的核苷酸序列上进行取代、缺失和/或添加一个或多个核苷酸。
根据权利要求8-10之任一所述的方法，所述突变通过物理诱变、化学诱变、ZFN、TALEN或CRISPR/Cas9等技术获得。
根据权利要求11所述的方法，其中所述的CRISPR/Cas9技术所用的靶点序列选自下列组的序列之一:

(a)序列为SEQ ID NO：4、5、7、8、13、14、16、17、22、23、25、26、28、29、34、35、37、38、40、42、43、44、49、50、52、53、55、56、58、59、61、 62、64、65、67、68、70、71、73或74所示核苷酸序列中符合5’-Nx-NGG-3’序列排列规则的片段，其中N表示A、G、C和T中的任一种,14<X<30,且X为整数,Nx表示X个连续的核苷酸；

(b)与(a)所述的多核苷酸互补的多核苷酸。
根据权利要求12所述的方法，其中所述的CRISPR/Cas9技术所用的靶点序列如SEQ ID NO:76-79、80-95之任一所示的序列。
根据权利要求8-13之任一所述的方法，所述基因突变后的核苷酸序列如SEQ ID NO:97、98、100-105之任一所示。
一种非作为繁殖材料的植物细胞、组织、器官或产品，所述植物细胞、组织、器官或产品含有权利要求1-7之任一所述的基因突变体核苷酸序列。
权利要求8-14之任一所述的方法、及其获得的突变体材料在育种中的应用。
根据权利要求16所述的应用，其中所述的在育种中的应用是指通过基因突变或与突变体材料杂交的方式，使植株获得该基因突变体，籽粒呈现变大的表型。