跳到主要内容

对扩展蛋白基因家族的全基因组鉴定揭示了这一点棒曲霉素基因参与了棉花纤维细胞的生长

抽象的

背景

expansins(Exps.),一组松开植物细胞壁和纤维素材料的蛋白质,参与调节细胞生长和植物中不同的发育过程。然而,这种基因家族在棉花的生物学功能仍然未知。

结果

在本文中,我们总共识别了93个棒曲霉素基因陆地棉.这些基因被分为4个亚家族,包括67个GhEXPAs, 8GhEXPBs6GhEXLAs, 12ghexlbs.,并分为15个子组。93.棒曲霉素基因分布在24条染色体上,Ghir_A02和Ghir_D06除外。所有GhEXP基因包含多个外显子,每个GhEXP蛋白具有多个保守基序。转录谱分析和qPCR分析表明棒曲霉素基因在棉纤维发育的不同阶段具有明显的表达模式。其中,3个基因(GhEXPA4oGhEXPA1A, 和GhEXPA8h)在起始阶段,9个基因高度表达(GhEXPA4aghexpa13a.GhEXPA4fGhEXPA4qGhEXPA8fGhEXPA2GhEXPA8gGhEXPA8a, 和GhEXPA4n)在快速伸长阶段和伸长阶段的表达高ghexla1c.ghexla1f.在纤维发育的过渡阶段优先表达。

结论

我们的研究结果为进一步阐明其生物学功能提供了坚实的基础棒曲霉素基因与棉花纤维开发和未来作物改善有价值的遗传资源。

背景

膨化蛋白是一种广泛存在于高等植物、细菌和真菌中的细胞壁松弛蛋白。膨化蛋白可以解锁壁多糖网络而不具有裂解活性,允许膨胀驱动的细胞扩大[1].植物扩展素通常为250至275〜275个氨基酸残基,并且大多数在N末端具有信号肽;信号肽通常为20至30个氨基酸残基[23.].植物膨化蛋白的典型结构是鱼雷状的蛋白质,包含两个结构域,结构域I和结构域II。结构域I是一个六链双psi beta-barrel (DPBB),与糖苷水解酶家族45 (GH45)蛋白的催化结构域相似,并包含一个保守的hise - phe - asp (HFD)。然而,DPBB结构域并不具有与GH45相同的催化活性。域II与群2草花粉过敏原同源[2],最近被归类为family-63碳水化合物结合模块(CBM63) [24.].

将植物扩展素超家族分为四个亚壳,其包括α-膨胀蛋白(expa),β-扩展蛋白(EXPB),脱脂蛋白样A(Exla)和扩展素样B(ExLB)。首先将扩展素鉴定为内源蛋白诱导McQueen-Mason组在植物中诱导细胞壁延伸的蛋白[5.].研究表明,它们参与了许多发育过程,并在细胞生长和扩大、花粉管侵入柱头(草)、果实成熟时壁的解体、脱落、抗逆性和其他细胞分离事件中发挥了作用[126.7.].

棉纤维是单细胞胎儿,其与胚珠表皮区分,这是一种强大的细胞膨胀和墙壁生物生物生物生物生物生物生物生物生物生物生物生物生物生物生物生物学系统[8.].棉纤维发育过程可分为五个阶段:起始、伸长、过渡、二次壁合成和成熟[9.].一些棒曲霉素分离和鉴定优先以棉纤维表达的基因,并使用几种不同的方法鉴定,包括cDNA阵列,降解PCR,RT-PCR等[10.11.].职能棒曲霉素棉纤维发育的基因已被进一步研究。表达的GhEXPA8gydF4y2Ba可以改善棉纤维长度和微米素值[12.].Gbexpatr.,一个Gossypium Barbadense.-特异性膨胀素,也可通过细胞壁重组增强棉纤维伸长[13.].ghrdl1.定位于细胞壁并与GhEXPA1和过表达的棉花植物ghrdl1.GhEXPA1有增加的纤维长度并产生更多棉铃[14.].GhEXPA1表达水平由转录因子调节GhHOX3,可促进棉纤维伸长[15.].

因此,膨化蛋白在棉纤维开发中具有重要作用。棉花基因组已经排序,并连续重新排序[16.17.18.19.].这些基因组数据可以使基因组鉴定为可能的基因家族。陆地棉拥有复杂的同种异体四倍体基因组(Aadd; 2n = 52),这是由两倍二倍体棉基因组的加倍,具体而言,Gossypium。arboreum(AA;2n = 26)和Gossypium raimondii.(DD; 2N = 26)[17.20.21.].目前,陆地棉占世界天然纤维产量的90%。因此,我们主要研究的是整体棒曲霉素基因家族G. Hirsutum在本文中。该研究可以提供关于棉花的基因组信息棒曲霉素并促进了对其生物学功能的进一步研究棒曲霉素棉纤维开发期间的基因和其他发育过程。

结果

棉膨胀素基因家族的鉴定及序列分析

我们已经在G. Hirsutum基因组。结果,98名候选人棒曲霉素最初获得基因。根据保守扩展域的分析,93棒曲霉素最终确定具有DPBB-1(结构域I)和Pollen_Allerg_1(结构域II)结构域的基因以进一步分析。每个棒曲霉素基因是根据命名准则命名的。具体结果如表S所示1.expansin基因家族包含四个亚家族,包括EXPA、EXPB、EXLA和EXLB。扩展蛋白基因家族g . arboreumg . raimondii就.进行相同的分析方法。结果,49和45棒曲霉素在中发现基因g . arboreumg . raimondii就分别的基因组。这些棒曲霉素基因也被分为4个亚家族。具体结果如表S所示2和表年代3.

我们分析了膨胀蛋白的生化特性(表S1).expansin家族成员的pI值范围为4.65 (GhEXLB1l) ~ 12.01 (GhEXPA4c),平均为8.47。除GhEXPA8b和GhEXPA7d外,EXPA和EXLA成员的pI值均在7.0以上。但除GhEXPB3a、GhEXPB3b、GhEXPB1a、GhEXPB1b、GhEXLB1d和GhEXLB1j外,所有expb和exb的pI值均低于7.01:表S1)。expansin家族成员的平均MW为27.42 kD,范围从14.29 (GhEXPA17e)到41.53 (GhEXPA5e) kD。expansin蛋白序列长度范围为150 (GhEXLA17e)氨基酸(aa)至366 aa (GhEXPA5e),信号肽长度范围为17 (GhEXPA15d, GhEXPA15g和GhEXLA1d)至35 (GhEXLA1a) aa(附加文件)1:表S1)。

来自93种扩展蛋白的多序列对准结果G. Hirsutum表明它们具有相似的序列特性:其中大多数由信号肽和保守的域I和II组成(附加文件2:图S1),与前一项研究的结果一致[3.].结构域I的氨基酸序列比结构域II的氨基酸序列更保守,特别是在EXPA成员中(Additional file)2:图S1)。值得注意的是,几乎所有的Expas(不包括GhExpa13a,ghexpa13b和ghexpa15d)和三个exla成员(Ghexla17a,ghexla17b和ghexla17c)包含一个域I中的保守:附加文件2:图S1)。EXPB,EXLB和六名其他exla成员的成员没有HFD主题。六个EXLAS包含一个名为C Terminus的EXLA扩展的额外段。EXLA延伸序列特征仅在EXLA亚家族中发现,并且EXLA延伸的氨基酸序列如下:“倾析(Q)EGCS(F)P(H)CDD(Y)S(G)H(n)WR( - )“。此外,在几乎所有扩展成员中都发现了一个名为Box 1的保守主题(附加文件)2:图S1)。

棉花的系统发育关系、基因结构和蛋白质基序棒曲霉素基因

为评价棉花膨化蛋白的进化关系,构建了系统发育树。expansins被分为EXPA、EXPB、EXLA和EXLB四个主要亚家族。EXPA亚家族是最大的群体,有67个成员,其他亚家族包括8个(EXPB)、6个(EXLA)或12个(EXLB)成员。四个expansin亚家族包括15个亚组(图)。1).我们发现expa-IV是最大的子组,其中包括17名扩展蛋白成员,expa-VII,EXPA-VIII和Expa-IX是最小的子组,只有两个扩展成员。

图。1
图1

系统发育分析与亚家族分类棒曲霉素棉花的基因(ghexps).采用MEGA 6.0软件,采用邻域连接法(NJ),采用1000个bootstrap重复构建系统发育树。粉色实心圆圈代表棉花棒曲霉素基因陆地棉;蓝色实心三角形代表棒曲霉素基因拟南芥蒂利亚纳.GH,陆地棉;在,拟南芥蒂利亚纳

基因结构(外显子组织)分析结果表明,扩张素成员包括两至五个外显子,并且相同的亚壳具有类似的外显子类型的特征(图。2a, b).大部分的扩张成员有三个外显子(51名,共67名的扩张成员)。十二个的扩张有两个外显子,四个的扩张有四个外影。所有成员EXPB亚家族有四个外显子ghexpb1a.(五个外显子)。四EXLA成员有五个外显子,两个成员有四个外显子。EXLB成员有四人(七人exlbs.)或五个外显子(五个exlbs.).

图2
figure2

系统发育关系,基因结构和蛋白质领域架构GhEXP基因。一种93 GHEXP蛋白的系统发育关系。采用MEGA 6.0软件,采用邻域连接法(NJ),采用1000个bootstrap重复构建系统发育树。B.基因结构(外显子组织)分析ghexps.通过gene Structure Display Server 2.0在线绘制基因结构[22.].cds、内含子和utr分别用红方框、蓝线和绿方框标记。比例尺显示在底部。CGhEXP蛋白的保守结构域分析。不同颜色的盒子代表GhEXP蛋白的不同保守基序

我们鉴定了扩增蛋白中的保守基序。结果,总共确定了10个不同的母题(图。2C,附加文件2:图S2)。所有棉织物的图案都具有统一的特点;例如,每个expansin蛋白都含有motif 5,除GhEXPA15d、GhEXPA17e和GhEXLB1j外,其余蛋白均含有motif 4。此外,在同一亚科中,母题的类型、排列和数量是相似的。超过一半的EXPA成员(38/67)拥有7个主题,21名成员拥有6个主题。EXLA, EXPB和EXLB亚科拥有类似的主题特征,和他们中的大多数包含五个图案(图案4、5、7、8和9)。GhEXPB2d和GhEXPB3b EXPB亚科包括四个主题,和三个成员(GhEXLB1g、GhEXLB1c和GhEXLB1j) EXLB也有相同数量的图案。这些结果表明,exb、EXLA和EXLB亚家族具有密切的进化关系。基因结构和序列基序之间的相似性表明,棉花膨化蛋白家族基因在进化过程中经历了复制。

扩增蛋白基因家族的染色体定位及共线性分析

染色体位置GhEXP基因在G. Hirsutum.结果如图2所示。3..总计93棒曲霉素除Ghir_A02和Ghir_D06外,基因分布在24条染色体上。Ghir_A05染色体包含8条染色体棒曲霉素而Ghir_A06只包含一个基因棒曲霉素基因。的数量棒曲霉素位于其他染色体上的基因范围为两到七个。另外,一些棒曲霉素基因以簇状排列在染色体上;例如,Ghir_A08和Ghir_D08都拥有一个具有四个不同EXLBs的基因簇(图2)。3.).这些结果表明了棒曲霉素每条染色体上的基因分布不均。共线性分析表明棒曲霉素基因在A和D亚基因组之间经常共线(图。4.),这表明棒曲霉素具有共线关系的基因可能具有类似的功能。

图3.
图3

染色体分布GhEXP基因。染色体名称高于每条染色体,染色体上的蓝线是基因名称

图4.
装具

联合性关系GhEXP陆地棉花的基因。内色系在棉花的同源染色体上表现为同线块棒曲霉素基因和A和D亚基因组之间

调查独联体启动子区域中的元素棒曲霉素基因

我们确定了独联体-棉花膨胀蛋白基因家族的作用调控元件。结果表明独联体- 处理监管要素棒曲霉素基因非常多样化(附加文件1:表S4;表S5)。这些元素分为7类和111种,其中包括31种轻响应元素,7种显影相关元素,13个激素响应元素,5个环境应力相关的元素,3个启动子相关元素,7个网站结合相关元素和44其他元素(无功能)。其中,光和激素响应类型特别丰富(附加文件1:表S4;表S5)。

所有93GhEXP基因中含有15200个元素,包括1268个光响应元素、144个发育相关元素、779个激素响应元素、409个环境胁迫相关元素、9416个启动子相关元素、81个位点结合相关元素和3103个其他元素(附加文件)1:表S4)。在93中GhEXP基因,83拥有一个盒子4元件(涉及光反应性的保守DNA模块的一部分),70具有GT1主题(光响应元件),57具有G盒(独联体-作用调控元件参与光响应)独联体-作用元件参与脱落酸反应),75个含有ERE, 56个含有TGACG基序和TGACG基序,它们是独联体- 涉及MEJA响应性的监管元素,73个题为厌氧诱导必不可少的患者(CIS作用调节元件),40个具有MBS(涉及干旱诱导性的MYB结合位点)。此外,这些相对丰富的元素也更加保守GhEXP基因家庭。另外,所有的GhEXP基因含有一个CAAT盒和TATA盒,是真核生物中启动子的核心元素,这些基因包含最多的这些元素(附加文件1:表S5)。

的表达模式棒曲霉素棉纤维基因

为了全面研究棉膨胀素基因家族的时间表达模式,不同发育阶段的纤维样品用于转录组分析。用这些转录组数据构建热图(图。5.).86年棒曲霉素基因表现出不同的表达模式。剩下的7个棒曲霉素转录组数据中未检测到基因。虽然表达模式棒曲霉素基因表现出明显的差异,聚集在一起棒曲霉素基因通常具有相似的表达模式。例如,GhEXPA1dGhEXPA15dGhEXPA15aGhEXPA4oGhEXPA4aGhEXPA4b是纤维起始和伸长阶段(0 ~ 15dpa)的优先表达基因,而ghexla1f.ghexla1c.在中间和后来的棉纤维发育阶段(15 dPA后)具有更高的表达。此外,GhEXPA4fGhEXPA2,位于A和D次基因组上的两个同源基因分别从3DPA急剧上调,具有非常相似的表达模式(图。5.),提示它们在棉纤维发育过程中可能具有相似或互补的功能。为了验证我们的转录组结果GhEXP使用公开的RNA-SEQ数据进一步证实基因表达谱。表达概况GhEXP基因与我们的转录组结果基本一致(图。5.和图S3)。

图5.
figure5

表达谱的GhEXP不同棉纤维发育阶段的基因。根据RNA-seq数据构建热图。不同的颜色代表不同的表达水平GhEXP基因。图例表示对数变换后的log2值。DPA,日花期后;FPKM,每千碱基的转录本,每百万映射读数的片段

避免缺少可能的重要棒曲霉素我们还分析了七个基因的转录水平棒曲霉素未在转录组数据中未检测到的基因(图。5.;表的年代1).qRT-PCR结果表明棒曲霉素基因几乎没有表达,除了ghexlb1h.,胚珠和纤维的表达水平低。此外,我们发现这些基因可以在其他组织中检测到,但它们的表达水平不高(附加文件2:图S4)。

QRT-PCR分析特殊棒曲霉素棉纤维中的基因

进一步识别密钥棒曲霉素涉及纤维细胞生长的基因,14棒曲霉素主要在棉纤维的不同发育阶段表达的基因被选中以使用QRT-PCR实验验证它们的表达水平。这些棒曲霉素基因在起始、伸长或过渡阶段明显上调(图。6.)与转录组数据中的那些相比,显示几乎一致的表达倾向(附加文件2:图S5)。

图6.
figure6

表达模式为14ghexps在棉纤维的不同发育阶段。一种三种表达概况GhEXP纤维起始期高表达基因。B.九个表达概况GhEXP在纤维伸长级高度表达的基因。C两个表达式概要GhEXP基因高度表达在二级壁合成阶段。用三个独立的重复进行QRT-PCR实验,并且该图中的误差条代表来自三个独立实验的SDS

我们发现了GhEXPA4oGhEXPA1a, 和GhEXPA8h主要在0dPa处表达(图。6.a),表明这三种基因可以在纤维细胞的初始发育阶段起作用。九棒曲霉素基因显示在纤维伸长级的表达水平较高,具有明显的表达特征(图。6.b)。表达GhEXPA4a在3 dpa达到峰值,ghexpa13a.GhEXPA4f达到5 dpa。的表达水平GhEXPA4qGhEXPA8f, 和GhEXPA2在7 DPA时最高,而GhEXPA8gGhEXPA8a, 和GhEXPA4n在10dpa时达到峰值(图。6.b)。GhEXPA4fGhEXPA2是异源四倍体棉花种的同源基因,分别位于第10染色体的A亚基因组和D亚基因组中,这两个基因在棉纤维细胞中都有特异性表达。此外,我们发现GhEXPA8aGhEXPA8g是棉纤维伸长的重要基因。这些结果表明,大部分基因的表达高峰出现在7 - 10dpa之间,通常称为快速延伸阶段。另外,我们得到了两个棒曲霉素主要在过渡阶段表达的基因,命名ghexla1c.ghexla1f.(图。6.c).它们都属于EXLA亚家族,生物学作用尚不明确。的表达水平ghexla1c.ghexla1f.在20dPa中是最高的,这是纤维细胞的过渡阶段从快速伸长到次级细胞壁合成。

为了更好地理解14的势函数棒曲霉素在根、下胚轴、茎、叶、花萼、花瓣、花粉、柱头和纤维等11个组织中检测到0 DPA、10 DPA和20 DPA的表达谱。结果表明,这些基因表现出不同但部分重叠的表达模式(附加文件2:图S6)。

讨论

本文首次报道了陆地棉膨化蛋白基因家族,该家族共有93个成员。所有的基因都有两个保守结构域,DPBB_1和Pollen_allerg_1,这与其他植物的结果一致,如A. Thaliana.[3.),烟草(22.], 番茄 [23.]和大枣[24.].因此,它们是典型的植物扩展蛋白[2].系统发育分析显示,93个棉膨胀汀分为四个亚壳的15个亚组(图。1).expansin亚群的数量与祖先的数量一致,包括15 ~ 17个棒曲霉素这些祖先中的每一个都进化成了系统进化树中现存的分支[25.].因此,我们推测现有的棉花膨化蛋白家族的每个分支都可能是由每个分支的祖先扩展而来。此外,棉花棒曲霉素每种亚家族内的基因具有结构相似性,并且它们也显示出四个亚壳之间的结构差异(图。2b).祖先的结构和进化特征与其他植物扩展素基因家族一致[22.23.24.].在同一亚家族范畴甚至亚群中,大多数成员几乎具有相同的保守基因结构和基序分布(图1)。2B,C),进一步证实了它们的密切进化关系和系统发育分类[26.].

我们的研究表明的扩张棉花亚家族基因显著扩增,共67个的扩张(图。1);这种扩张的扩张建议这种重要的功能棒曲霉素棉花生长发育中的基因。相反,其他三个扩展素亚属相对的成员较少的扩张:8EXPBs6Exlas.12.exlbs..棉的比例棒曲霉素每个亚家族的基因几乎与其他二联体的基因一致,如A. Thaliana.(26的扩张6EXPBs3Exlas., 1EXLB)、葡萄(20的扩张, 4EXPBs, 1EXLA和4exlbs.)、枣(19的扩张3EXPBs, 1EXLA和7exlbs.)、大白菜(39岁的扩张, 9EXPBs, 2Exlas., 3exlbs.)[23.24.27.28.].单子叶植物的比例不同,如水稻(33的扩张,18EXPBs, 4Exlas., 1EXLB)和玉米(36的扩张,48EXPBs和图4Exlas.)[3.29.],最重要的差异是EXPBs单子叶植物比双子叶植物多[2].此外,数量GhEXP基因(93)与49个基本一致Gaexp.45格雷克斯.通过比较分析,我们发现4个expansin亚家族也存在于g . arboreum(38的扩张, 4EXPBs, 2Exlas., 5exlbs.),g . raimondii就(33的扩张, 4EXPBs3Exlas., 5exlbs.)(附加文件1:表S2;额外的文件1:表S3)。结果表明,两个祖先物种的A和D基因组是现代异源四倍体基因组的供体G. Hirsutum[20.].这些结果提供了重要的见解的进化和功能棒曲霉素棉花的基因。

基于表达概况棒曲霉素在棉纤维发育的不同阶段,我们获得了14个主要表达基因,其中12个是主要表达基因的扩张和2Exlas.(图。6.),不含EXPBsexlbs..三个的扩张基因,GhEXPA4oGhEXPA1a, 和GhEXPA8h,首先在纤维发育的早期阶段获得,并在QRT-PCR中显示高表达水平(图。6.一个);然而,它们在纤维发展的初始阶段的作用仍然需要澄清。此外,我们还获得了9个棒曲霉素延伸期表达水平较高的基因(图。6.b)。在九个中棒曲霉素基因,GhEXPA4fGhEXPA2在棉纤维发育过程中具有最高的转录水平,并且它们是不同组织中最优先表达的基因(图。6.b;额外的文件2:图S6b)。的表达水平GhEXPA4f和报道的高度一致吗GhExp1,纤维含量高[30.].其同源基因GhEXPA2显示了相似的表达模式,这一结果几乎与GhExp2表达水平[30.].转基因植物GhEXPA1和它的合作伙伴ghrdl1.表现出改善的棉纤维产量[14.]和过度表达GhEXPA8gydF4y2Ba可提高棉纤维长度[12.].通过对基因序列的比较分析,我们证实了这一点GhEXPA4f(本研究中的名称,GHIRA10G15240),GhExp1[30.] 和GhEXPA1[14.]是相同的基因,以及GhEXPA2(本研究中的名称,ghird10g12330)和GhEXPA8gydF4y2Ba.我们的qRT-PCR结果也揭示了两者的重要性棒曲霉素棉花发展中的基因。其他七个新的棒曲霉素这些基因主要表达于棉纤维发育的伸长阶段,这些基因在促进纤维伸长方面的功能有待进一步研究。有趣的是,我们发现GhEXPA8aGhEXP8g是同源的ATEXP8A. Thaliana.ATEXP8可以促进缺口伸长A. Thaliana.[31.].这个结果意味着GhEXPA8aGhEXP8g可以促进棉花中的纤维细胞伸长率。功能机制GhEXPA8aGhEXP8g将是我们未来的重要研究课题之一。上述棒曲霉素基因是的扩张在纤维发育的初始和延伸阶段表达的亚家族。这可能是因为有更多的成员的扩张(67/93) expansin家族的亚家族。此外,这些数据还表明棒曲霉素expa亚家族的基因在棉纤维开发中是必不可少的。

exla和exlb是两个较小的扩展素亚属。系统发育分析表明,这些蛋白质构成了分离良好的组;但是,他们的生物学功能不确定[2].在本文中,我们发现了两个EXLA基因,简称为ghexla1c.ghexla1f.,高表达在20dPa(图。6.c),这是纤维细胞的过渡阶段从快速伸长到次级细胞壁合成。这些结果表明它们是在过渡阶段期间的重要基因,其中进行纤维素合成以制备二次壁增厚时段。目前,除了那些的exla职能相对较少Atexla2.拟南芥蒂利亚纳Atexla2.在下胚轴和根部均有明显的表达;表达的Atexla2.导致在非快速伸长的光学胶质细胞中略微厚的壁[32.].系统进化树分析表明ghexla1c.ghexla1f.Atexla2.为EXLA亚家族的成员(图。1).这些结果表明ghexla1c.ghexla1f.可以参与细胞壁的增厚。此外,据报道,类似的蛋白质来自Hahella chejuensis能结合纤维素,增强纤维素酶活性[33.].这暗示了这两个EXLA基因可以促进纤维素的合成;然而,EXLAs在棉纤维开发中的具体生物学功能仍有待评价。为了更好地理解和利用EXLAs,无论是在理论上还是在实践中,都需要进行更多的研究。

结论

总的来说,我们成功地进行了基因组规模分析棒曲霉素陆地棉花的家族基因,特别强调纤维发育。总共93种棉花棒曲霉素基因。我们的分析为了解棉花膨化蛋白超家族提供了信息,包括基因进化、基因结构、蛋白质基序、共线关系、独联体- 传递元素和基因表达模式。此外,我们获得了14的表达模式棒曲霉素不同时期棉纤维发育的相关基因。其中,3个基因在初始阶段高表达,9个基因在快速伸长阶段高表达ghexla1c.ghexla1f.在纤维发育的过渡阶段优先表达。这些结果为进一步阐明其生物学功能奠定了基础棒曲霉素基因和棉花中许多重要农业特征的分子机制,特别是在棉纤维发育的伸长阶段。

方法

植物材料

陆地棉L. (' TM-1 ')种子来源于中国农业科学院棉花研究所(安阳)。本实验以TM-1为实验材料。在中国农业科学院棉花研究所试验场(36°06′84.44″N, 114°49′61.5″E)种植。研究的表达模式棒曲霉素在棉纤维发育过程中,每朵花都在开花当天标记,认为开花后0天(DPA)。随后,在0、3、5、7、10、15、20、30 DPA处采集样本。收集的铃被解剖以获得胚珠和纤维。对于0 ~ 3 DPA样品,我们收集胚珠,对于5 ~ 30 DPA样品,我们收集纤维。此外,我们还采集了棉花不同发育阶段的组织样本,包括苗期的根、下胚轴、茎和幼叶,成虫期的花萼、花瓣、花粉和柱头。不同样品采集后立即用液氮冷冻,在−80°C超低温冰箱中保存。

棉花的鉴定与序列分析棒曲霉素基因

棉基因组数据是从棉花FGD网站获得的[34.)(https://cottonfgd.org/).扩展蛋白蛋白序列A. Thaliana.从TAIR 10下载(http://www.arabidopsis.org/).首先,我们使用来自35种扩展蛋白蛋白序列A. Thaliana.作为搜索的查询G. Hirsutum基因组数据库(19.].使用默认参数的BLASTP用于识别扩展蛋白。之后,我们使用“扩展”作为关键字搜索数据库以获取同源物;最后,我们使用6次报道ghexps作为查询,以搜索其他可能ghexps通过BLASTP搜索棉花基因组[30.].对比分析后删除多余的expansin序列。然后,所有候选的expansin蛋白序列提交到NCBI CDD (conservative Domain Database)数据库(https://www.ncbi.nlm.nih.gov/structure/cdd/wrpsb.cgi.)[35.]鉴定了保守域的地方。为确保快速搜索速度,我们使用批处理Web CD-Search工具执行此工作(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)[35.,其中每个请求的最大蛋白质查询数为4000,为我们的目的提供了足够的处理能力。我们使用默认参数执行搜索程序。典型的expansin蛋白包含两个保守结构域:DPBB-1(包括DPBB_1超家族)和Pollen_allerg_1(包括Pollen_allerg_1超家族)。我们获得了陆地棉膨化蛋白家族基因的最终序列,以供进一步分析。

使用扩展的在线工具[36.)(https://www.expasy.org/resources/等电点(pI),利用SignalP 5.0服务器(http://www.cbs.dtu.dk/services/SignalP/).扩展蛋白序列的序列对准在载体NTI前进11软件(版本11.5)中进行,然后搜索扩展蛋白的保守氨基酸和结构域特性。

种系发生树结构

分析系统发育关系,拟南芥蒂利亚纳A. Thaliana.)扩展蛋白蛋白序列从TAIR下载(https://www.arabidopsis.org/)及expansion in CENTRAL (http://www.personal.psu.edu/fsl/expcentral /).鉴定的棉花扩展素的多序列对准A. Thaliana.expansin蛋白在MEGA软件(版本6.0)中执行[37.使用邻接方法,用相同的软件构建和系统发育树。Bootstrap Reparicates的数量为1000,并且将参数的其余部分设置为默认值。

分析棒曲霉素基因结构和主题

进行基因结构分析以鉴定外显子,内含子和UTR。相应的识别GFF数据棒曲霉素从新的棉花基因组数据中从名为Ghirsutum_gene_model的GFF文件中提取基因ID [19.)(http://cotton.hzau.edu.cn/en/download.php.),然后是棒曲霉素GFF数据使用在线工具GSDS(2.0版,http://gsds.cbi.pku.edu.cn/)[38.];结果以SVG图像格式保存。使用在线工具MEME分析扩展蛋白序列的图案(http://meme-suite.org/index.html)[39.].根据所需的文件格式,我们将扩展序列导入在线工具。最大类型的图案设置为10,重复编号设置为0或1,并且将参数的其余部分设置为系统默认值。使用Adobe Illustrator CS3软件(版本13.0.0)进一步修改了基因结构和基因in的输出草案。

染色体位置及共线性关系棒曲霉素基因

我们从新的基因组数据中获得了每个染色体的长度[19.],得到所有TM-1染色体的长度文件。的位置信息棒曲霉素从GFF文件中提取染色体的基因,在新的棉花基因组数据中命名为Ghirsutum_gene_model(http://cotton.hzau.edu.cn/en/download.php.)[19.];对象的位置信息文件棒曲霉素获得基因。之后,将两个文件提交到在线工具MG2C(http://mg2c.iask.in/mg2c_v2.0/)分析棒曲霉素染色体上的基因定位。棉花共线性分析棒曲霉素基因由MCScanX软件执行[40],并使用电池软件进行结果的可视化[41.].分析的结果以SVG格式导出,SVG图像与Adobe Illustrator CS3软件(版本13.0.0)进一步修改。

分析独联体- 在启动子地区的监管要素棒曲霉素基因

棉花的启动子区(2000年转录的转录位点上游序列)的棉花棒曲霉素通过搜索来确定基因G. Hirsutum基因组数据库(https://cottonfgd.org/)[34.[然后使用PlantCare预测这些启动子序列(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)分析独联体- 为元素[42.].

棉花的转录组分析棒曲霉素基因

从胚珠和纤维样品中提取总RNA。来自不同阶段的样品用于用Illumina平台进行转录组分析,包括在0和3dPa和5,7,10,15,20和30dPa的胚珠下的胚珠。对于转录组测序,对实验样品进行了三种生物重复率。基因表达的测序结果由FPKM(每千次映射读数读数)值表示。表达数据FPKM值棒曲霉素根据转录组结果筛选基因并转化为LogFPKM值。同时,我们从公共数据库,棉花FGD网站下载了RNA-SEQ数据,棉花胚珠和纤维(https://cottonfgd.org/)[34.],包括在5,10,15和20dPa的3,0,15和3dPa和纤维的胚珠。如上所述处理FPKM值。使用HEMI软件(版本1.0)用对数转换值(1.0版)绘制的热量表[43.].

RNA分离和实时定量PCR分析

使用RNAPREP纯试剂盒(用于多糖和多苯酚的植物,提取来自不同阶段的样品的总RNA;猫。没有。DP441;天根,北京,中国)。使用琼脂糖凝胶电泳检查RNA样品,然后用纳米玻璃分析浓度和质量C(赛默费雪科学公司,美国)。根据PrimeScript™II第一链cDNA synthesis Kit (TaKaRa, Code No. 6210A)的说明书,在2720热循环器(Applied Biosystems, Thermo Fisher Scientific, USA)上进行cDNA合成。所有反转录cDNA样品稀释10倍,保存在−20℃,用于实时定量PCR (qRT-PCR)实验。利用Beacon Designer软件(8.0版)设计特异性qRT-PCR引物;所有引物见表S6..QRT-PCR使用TB Green TM Premix EXQ™II套件(Takara,代码编号RR820A)进行,并在QuantStudio™5实时PCR仪器(Applied Biosystems,Thermo Fisher Scientific,USA)上进行。ubq7.(基因库。AY189972)作为内参基因,计算相对表达量。数据用2-ΔΔct方法(44.].

数据和材料的可用性

所有支持我们研究发现的数据和材料都包含在手稿的方法部分。详情见附件中的附加文件。

缩写

DPA:

黄花木后天数

Exps.

棒曲霉素

扩展:

α棒曲霉素

EXPB:

β-扩展素

exla:

像候选人一样

EXLB:

expansin-like b

DPBB:

双psi beta-barrel

ere:

Ethylene-responsive元素

CD:

编码序列

参考

  1. 1。

    •DJ。膨胀蛋白松开植物细胞壁。自然。2000; 407(6802):321-6。

    中科院PubMed.文章谷歌学术

  2. 2。

    •DJ。植物扩张素:多样性和与植物细胞壁的相互作用。植物学报。2015;25:162-72。

    中科院PubMed.pmed中央文章谷歌学术

  3. 3.

    Sampedro J,Cosgrove DJ。膨胀蛋白超家族。基因组Biol。2005; 6(12):242。

    PubMed.pmed中央文章中科院谷歌学术

  4. 4.

    Georgelis N, Yennawar NH, Cosgrove DJ。a型纤维素结合模块(CBM)和细菌膨胀蛋白的熵驱动纤维素结合的结构基础。中国科学院院刊2012;109(37):14830-5。

    中科院PubMed.pmed中央文章谷歌学术

  5. 5。

    McQueen-Mason S,Durachko MD,Daniel J. Cosgrove。两个内源性pmteins,植物中的细胞壁延伸。植物细胞。1992年; 4:1425-33。

    中科院PubMed.pmed中央谷歌学术

  6. 6。

    魏鹏,张晓强,赵鹏,王小春。保卫细胞扩张素对气孔开放的调控ATEXPA1..植物信号表现。2011; 6(5):740-2。

    中科院PubMed.pmed中央文章谷歌学术

  7. 7。

    Li Y,Darley CP,Ongaro V,Fleming A,Schipper O,Baldauf Sl,等。植物扩张素是复杂的多岛家族,具有古老的进化起源。植物理性。2002; 128(3):854-64。

    中科院PubMed.pmed中央文章谷歌学术

  8. 8。

    Kim HJ,Triplett Ba。植物和体外棉纤维生长。植物细胞伸长和细胞壁生物发生模型。植物理性。2001; 127(4):1361-6。

    中科院PubMed.pmed中央文章谷歌学术

  9. 9。

    棉纤维:细胞壁和纤维素研究的一个强大的单细胞模型。植物学报2012;3:104。

    中科院PubMed.pmed中央文章谷歌学术

  10. 10。

    C,Saha S,Jenkins JN,Scheffler是,威尔金勒,Betelly DM。棉花中扩张素基因的转录组分析,序列表征和基于SNP的染色体分配。Mol Gen Genomics。2007; 278(5):539-53。

    中科院文章谷歌学术

  11. 11.

    吉SJ,卢YC,冯JX,Wei G,Li J,Shi Yh等。通过降解PCR和cDNA阵列在早期棉纤维发育期间优先表达基因的分离和分析。核酸RES。2003; 31(10):2534-43。

    中科院PubMed.pmed中央文章谷歌学术

  12. 12.

    Bajwa Ks,Shahid Aa,Rao Aq,Bashir A,Aftab A,Husnain T.稳定的转化和表达GhEXPA8gydF4y2Ba纤维膨化蛋白基因用于提高棉花纤维长度和马克隆值。植物学报。2015;6:838。

    PubMed.pmed中央文章谷歌学术

  13. 13。

    Li Y,Tu L,Pettolino Fa,Ji S,Hao J,Yuan D等人。Gbexpatr.,一种种特异性的膨化素,通过细胞壁重组增强棉纤维的伸长。植物生态学报;2016;14(3):951-63。

    中科院PubMed.文章谷歌学术

  14. 14。

    徐波,苟建勇,李发方,上官XX,赵波,杨春强,等。棉花BURP结构域蛋白与α -扩展蛋白相互作用,它们的共表达促进植物生长和果实生产。摩尔。2013;6(3):945 - 58。

    中科院PubMed.文章谷歌学术

  15. 15.

    单春梅,上官XX,赵波,张晓峰,赵丽梅,杨春强,等。同源结构域转录因子对棉纤维伸长的控制GhHOX3.Nat Commun。2014;5:5519。

    中科院PubMed.pmed中央文章谷歌学术

  16. 16。

    张特,胡y,江w,方l,guan x,chen j等。分子素​​棉花的测序(陆地棉L. ACC。TM-1)提供了一种用于纤维改进的资源。NAT BIOTECHNOL。2015; 33(5):531-7。

    中科院PubMed.文章谷歌学术

  17. 17。

    李飞,范光国,王凯,孙飞,袁勇,宋光国,等。栽培棉花的基因组序列Gossypium Arboreum..NAT Genet。2014; 46(6):567-72。

    中科院PubMed.文章谷歌学术

  18. 18。

    Ma Z,他,王X,Sun J,Zhang Y,Zhang G等。重新安排普通棉的核心集合鉴定了影响纤维质量和产量的基因组变异和基因座。NAT Genet。2018; 50(6):803-13。

    中科院PubMed.文章谷歌学术

  19. 19。

    王MJ,TU LL,Yuan DJ,朱D,沉C,李杰,等。两倍培养的同种异体四倍体棉花的参考基因组序列,陆地棉Gossypium Barbadense..NAT Genet。2019; 51:224-9。

    中科院PubMed.文章谷歌学术

  20. 20.

    李F,风扇G,Lu C,Xiao G,Zou C,Kohel RJ等。栽培高地棉花的基因组序列(陆地棉TM-1)提供对基因组进化的见解。NAT BIOTECHNOL。2015; 33(5):524-30。

    PubMed.文章中科院谷歌学术

  21. 21.

    王凯,王志,李飞,叶伟,王军,宋国光,等。二倍体棉花的基因组草图Gossypium raimondii..Nat麝猫。2012;44(10):1098 - 103。

    中科院PubMed.文章谷歌学术

  22. 22.

    丁岛,马罗瓦P,KONG YZ。烟草中扩展素基因家族的基因组鉴定(尼科尼亚塔哈瓦姆).Mol Gen Genomics。2016; 291(5):1891-907。

    中科院文章谷歌学术

  23. 23。

    陆永刚,刘芳芳,王旭,韩志华,欧阳波,张建华,等。番茄膨化蛋白基因家族的全基因组鉴定与表达分析。中国生物医学工程学报。2016;29(2):597-608。

    中科院文章谷歌学术

  24. 24。

    侯丽,张志勇,窦绍华,张艳,庞鑫,李艳。大枣中扩展蛋白基因家族的全基因组鉴定、鉴定及表达分析Ziziphus jujuba机)。足底。2019;249(3):815 - 29。

    中科院PubMed.文章谷歌学术

  25. 25。

    Sampedro J,Lee Y,Carey Re。depamphilis c,cosgrove dj。基因组史的使用改善基因家族的系统发育和对出生和死亡的理解。工厂J. 2005; 44(3):409-19。

    中科院PubMed.文章谷歌学术

  26. 26。

    张胜,徐瑞,高志强,陈超,蒋志强,舒华Malus x Domestica.中国生物医学工程学报。2014;29(2):251 - 256。

    中科院文章谷歌学术

  27. 27。

    kishhnamurthy P, Hong JK, Kim JA, Jeong MJ, Lee YH, Lee SI。扩展蛋白基因超家族的全基因组分析显示芸苔全基因组三份的RAPA特异性进化动力学。Mol Gen Genomics。2015; 290(2):521-30。

    中科院文章谷歌学术

  28. 28。

    Dal Santo S,Vannozzi A,Tornielli GB,Fasoli M,Venturini L,Pezzotti M等。扩大素基因超细的基因组分析揭示了葡萄种特异性结构和功能特性。Plos一个。2013; 8(4):E62206。

    中科院PubMed.pmed中央文章谷歌学术

  29. 29。

    张W,闫H,陈文,刘继,江C,江H,等。胚乳中表达玉米扩张素基因的基因组鉴定与表征。Mol Gen Genomics。2014; 289(6):1061-74。

    中科院文章谷歌学术

  30. 30.

    Harmer Se,Orford SJ,Timmis JN。六种α-扩展蛋白基因的表征陆地棉(陆地棉)。中国生物医学工程学报。2002;26(1):1 - 9。

    中科院文章谷歌学术

  31. 31。

    Ikeda M,Fujiwara S,MITSUDA N,OHME-TAKAGI M.一个局直基本的基本螺旋环 - 螺旋系统调节细胞伸长率拟南芥.植物细胞。2012; 24(11):4483-97。

    中科院PubMed.pmed中央文章谷歌学术

  32. 32。

    过表达AtEXLA2改变拟南芥黄化下胚轴的生长。安机器人。2015;115(1):67 - 80。

    中科院PubMed.文章谷歌学术

  33. 33。

    Lee Hj,Lee S. Ko H-J,Kim Kh,Choi I-G。来自Hahella Chejuensis的含蛋白样蛋白质结合纤维素并增强纤维素酶活性。mol细胞。2010; 29(4):379-85。

    中科院PubMed.文章谷歌学术

  34. 34。

    朱涛,梁长忠,孟ZG,孙国强,孟ZH,郭士东,等。cotton fgd:一个完整的棉花功能基因组学数据库。4 .生物医学工程学报,2017;

  35. 35。

    Marchler-Bauer A,Bo Y,Han Ly,He Je,Lanczycki CJ,Lu Sn,等。CDD / Sparcle:通过子类域架构的功能分类蛋白质。核酸RES。2017; 45(D1):D200-3。

    中科院PubMed.文章谷歌学术

  36. 36。

    王志强,王志强,王志强,等。ExPASy: SIB生物信息资源门户。核酸Res. 2012;40(Web服务器版):W597-603。

    中科院PubMed.pmed中央文章谷歌学术

  37. 37。

    Tamura K,SteCher G,Peterson D,Filipski A,Kumar S. Mega6:分子进化遗传学分析6.0版。mol Biol Evol。2013; 30(12):2725-9。

    中科院PubMed.pmed中央文章谷歌学术

  38. 38。

    胡b,金吉,郭艾,张h,罗j,高g. gsds 2.0:升级基因特征可视化服务器。生物信息学。2015; 31(8):1296-7。

    PubMed.pmed中央文章谷歌学术

  39. 39。

    Bailey TL,Boden M,Buske Fa,Frith M,Grant Ce,Clementi L等。MEME SUITE:主题发现和搜索的工具。核酸RES。2009; 37(Web服务器问题):W202-8。

    中科院PubMed.pmed中央文章谷歌学术

  40. 40.

    王y,唐,debarry jd,tan x,li j,wang x等。McScanx:一种用于检测和进化分析的工具包,对基因同步和共线性分析。核酸RES。2012; 40(7):E49。

    中科院PubMed.pmed中央文章谷歌学术

  41. 41.

    王志强,王志强,王志强,等。Circos:比较基因组学的信息美学。基因组研究》2009;19(9):1639 - 45。

    中科院PubMed.pmed中央文章谷歌学术

  42. 42.

    Lescot M,Dehais P,Thijs G,Marchal K,Moreau Y,Van de Peer Y等。Plantcare,植物顺式动作调节元件和促进剂序列中硅分析的工具的门户网站。核酸RES。2002; 30(1):325-7。

    中科院PubMed.pmed中央文章谷歌学术

  43. 43.

    邓红,王烨,刘泽,郑H,薛Y.Hemi:用于说明热插拔的工具包。Plos一个。2014; 9:11。

    谷歌学术

  44. 44.

    Livak KJ,Schmittgen TD。使用实时定量PCR和2的相对基因表达数据分析(-Delta Delta C(T))方法。方法。2001; 25(4):402-8。

    中科院文章PubMed.谷歌学术

下载参考

致谢

不适用。

资金

本研究由国家重点研发计划(No. 2018YFD0100402)和国家自然科学基金(No. 31621005)资助。资助机构没有参与这项研究的设计;收集、分析或解释数据;或写手稿。

作者信息

从属关系

作者

贡献

ZM和GS设计了这项研究。LL,DZ和XW进行了研究。HC,YZ和QW分析了数据。ll写了稿件。所有作者都读过并批准了稿件。

相应的作者

对应到郭丽歌要么Zhi-Ying马

伦理宣言

伦理批准和同意参与

不适用。

同意出版

不适用。

相互竞争的利益

提交人声明他们没有竞争利益。

额外的信息

出版商的注意

Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。

补充信息

附加文件1:表S1

.的识别GhEXP基因G. Hirsutum.额外的文件1表S2.这雅克基因g .植物园表S3.这GrEXP基因g . raimondii就表S4.的总结独联体表演的元素GhEXP基因。表S5.的数量独联体的启动子区参与不同生物过程的作用元件GhEXP基因。表S6.用于qRT-PCR实验的引物列表。

附加文件2:图S1

.93个GhEXP蛋白的序列比对。图。S2.的保守基序分析GhEXP棉花的基因。图S3.表达谱的GhEXP棉花胚珠和纤维的基因。图S4.定量RT-PCR分析七GhEXP基因存在于纤维的不同阶段和不同的组织中。图。S5.14例的qRT-PCR验证和转录组测序ghexps在不同的发展阶段。图S6.14种棉花的定量RT-PCR分析GhEXP不同组织中的基因。

权利和权限

开放访问本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/.Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信贷额度中另有说明。

再版和权限

关于这篇文章

通过Crossmark验证货币和真实性

引用这篇文章

Lv, LM。那Zuo, DY., Wang, XF.et al。对扩展蛋白基因家族的全基因组鉴定揭示了这一点棒曲霉素基因参与棉花纤维细胞生长。BMC植物BIOL.20.223(2020)。https://doi.org/10.1186/s12870-020-02362-020-02362-0.

下载引用

关键字

  • 棒曲霉素
  • 基因家族
  • 纤维
  • 基因表达谱
  • 陆地棉