摘要
背景
多倍化是在高血管植物的进化史上的常见事件,并且在多倍化后的简单基因组倍增的植物的基因组中存在一些变化。Allotetraploid.芸苔栗鸟及其二倍体祖细胞(B. Rapa.和B. Oleracea.)是研究与多倍化相关的问题的好组。另一方面,EIN3 / EIL.基因家族是植物中重要的基因家族,其所有成员都是乙烯信号通路中的关键基因。到目前为止,EIN3 / EIL.基因家族在显著它的二倍体祖细胞主要是未知的,因此必须全面识别和分析该基因家族。
结果
在这项研究中,13,7和7EIN3 / EIL.确定基因显著(2n = 4x = 38,aNCN),B. Rapa.(2n = 2x = 20,aR.) 和B. Oleracea.(2n = 2x = 18,cO.).所有经鉴定的EIN3/EIL蛋白可分为3个分支,再细分为8个亚分支。Ka/Ks分析结果表明,均能鉴别EIN3 / EIL.在重复事件后接受净化选择的基因。此外,基因结构分析显示了一些EIN3 / EIL.基因在显著多倍体过程中获得内含子,同源物表达偏倚分析显示显著会偏向二倍体祖先吗B. Rapa..启动子EIN3 / EIL.基因在显著包含更多的独联体-作用元件,主要参与胚乳基因的表达和光响应,比其二倍体祖细胞多。因此,显著在某些生物方面可能具有潜在的优势。
结论
结果表明了同种异体四倍体显著在某些生物方面可能具有潜在的优势。此外,我们的结果可以增加对演变的理解EIN3 / EIL.基因家族在显著,并为未来的多倍化研究提供了更多参考。
背景
多倍化被广泛认为是在Angiosperms中形成物种的重要机制[1那2那3.那4.].新形成的多倍体可能经历快速同源物丢失、基因表达模式改变、多倍体后基因组重组等变化[5.,在不同的多倍体中可能有很大的差异[6.].此外,一些基因家族在多倍体化过程中也会发生变化,如基因家族的扩展[7.].
这乙烯 - 不敏感3(EIN3)/乙烯 - 不敏感3样(EIL)基因家族是高等植物中一个小的转录因子基因家族[8.那9.].这EIN3 / EIL.基因通过激活下游亚乙基反应基因参与乙烯信号转导[10那11].乙烯(ET)是一个重要的气态植物激素,参与了调节植物生长,发育和衰老的一些重要生理过程[12].此外,乙烯可以充当信号分子,以调节一些基因的表达[13].就这样EIN3 / EIL.基因家族在植物中起着重要作用。EIN3 / EIL蛋白质的特征在于两个结构特征。一种特征是它们的N-末端氨基酸序列高度保守,具有几个显着的结构特征[14[除了第一个〜80个氨基酸残基外,这些序列也是蛋白质活性的必需影响[15那16].另一个特征是它们的C末端序列比其n末端序列更低。例如,在一些植物中,例如拟南芥蒂利亚纳[14[绿豆[13],多天冬酰胺或多谷氨酰胺区域广泛存在于EIN3/EIL蛋白的c端序列中,但这些特征在其他植物中未发现,如烟草[17].
一些功能和特点EIN3 / EIL.几种植物中的基因已经很好地研究过答:芥和烟草。Ein3调节其下游基因乙烯 - 反应因子1(ERF1)的表达,它还参与拟南芥中乙烯引发的转录调节[14那15].EIL3(或SLIM1)用作拟南芥中硫响应和代谢的中央转录调节剂[18那19].NTEIL2,ATSLIM1的同源物,直接调节硫饥饿诱导的一些基因的表达,通过与塔巴克菌菌的UP9C启动子结合[20.].以上结果表明,EIN3/EIL蛋白与乙烯和硫信号通路存在复杂的关系。
芸苔栗鸟,一种典型的异源四倍体芸苔属植物属,是世界各地种植的第三大石油作物。显著(2n = 4x = 38,aNCN)通过自然杂交和多倍化形成〜7500年B. Rapa.(2n = 20, AR.) 和B. Oleracea.(2n = 18, CO.).近年来,整个基因组B. Rapa.(Chiifu-401-42),B. Oleracea.(Capitata.-02-12)和显著(Darmor-bzh)已被测序并组装[21那22那23].本研究的目的是提高我们对此的理解EIN3 / EIL.异种情况下的基因家族显著并在形成期间探索该基因家族的变化显著.在本研究中使用了一些方法,包括基因结构分析,染色体定位分析,系统发育树质分析,同联和复制基因分析,启动子分析和表达谱分析。
结果
染色体定位与鉴定EIN3 / EIL.基因
使用BRAD数据库中的BLASTp程序进行识别EIN3 / EIL.基因在显著及其二倍体祖细胞(B. Rapa.和B. Oleracea.),查询序列是六个ein3 / EIL蛋白序列答:芥从TAIR数据库。所有候选蛋白序列经NCBI的CD-search确认,结构域ID为pfam04873。最终鉴定出7、7和13个基因EIN3 / EIL.基因在B. Rapa,B. oleracea和显著,分别。这些确定了EIN3 / EIL.基因的命名来源于BrEIL1来Breil4b.在B. Rapa.那Boeil1.来Boeil4b.在B. Oleracea.和BnCEIN3来Bnaeil4d.在显著(桌子1).这些名称中的最后一封信代表了与之同源的关系EIN3 / EIL.基因在答:芥,“一种“意味着最高的同源性,其次是'B.' 等等。这些信一种和C,后的BN.,表示AN和CN分别在基因名称中的次基因显著.
识别的物理位置EIN3 / EIL.基因在显著并通过MapInspector工具将其两个二倍体祖细胞置于相应的染色体中。二十七年二十五EIN3 / EIL.基因可以映射到组装的染色体(图。1),其他两个基因(BNCEIL2B.&Bnaeil3a.)位于未组装的脚手架上。七EIN3 / EIL.基因位于四种染色体上(aR.02年,R.03,AR.07年和R.10)在一个基因组中B. Rapa.,三种染色体只有五个基因(aN02年,N03和A.N10)在亚基因组中显著.比较亚基因组的基因分布显著用一个基因组B. Rapa.,相应染色体上的基因不仅是同源基因,而且它们也具有相同的相对位置,除了aR.07染色体,两个EIN3 / EIL.在形成过程中可能丢失的基因显著或由于这些染色体的不完全组装。此外,对C亚基因组的基因分布进行了比较显著用C基因组B. Oleracea.,只有几个EIN3 / EIL.基因在相应的染色体上保持它们的相对位置。另外,总共8种同源基因对(如Breil4a.&Bnaeil4b.那Breil3c.&Bnaeil3d.)在形成期间保持它们对染色体的相对位置显著.因此,一个次基因组显著在杂交和多倍体化过程中可能比C亚基因组更稳定。
EIN3/EIL蛋白的系统发育分析
共有8种不同物种的总共63份EIN3 / EIL蛋白序列用作参考序列,以构建系统发育树,包括6(拟南芥),7(B. Rapa.), 7 (B. Oleracea.)、13日(显著), 7 (奥雅萨苜蓿), 7 (Populus Trichocarpa.), 7 (Gossypium raimondii.)及9 (Zea Mays.(图)成员。2).这些63 eIN3 / EIL蛋白明显分为三个片状,被称为A,B和C,其含有8个亚片(A1,A2,B1,B2,B3,C1,C2和C3)。含有含有EIN3和EIL1蛋白,CLADE B含有EIL3蛋白,CLADE C组成,由EIL2,EIL4和EIL5蛋白组成。单焦和双点中的EIN3 / EIL蛋白质在该系统发育树中的不同亚片中聚集,例如单子叶植物中的EIN3 / EIL蛋白(Zea Mays.和奥雅萨苜蓿)在A2,B2和C1子分布中聚集,而在剩余的亚片中聚集在剩余的亚片中的艾因3 / EIL蛋白。Clade A有21艾艾宁3 / EIL蛋白质,CLADE B有19个蛋白质,并且CLADE C有23个蛋白质,所以EIN3 / EIL.基因均匀分为三个片状。
基因结构分析EIN3 / EIL.基因
基因结构的多样性是多基因家族进化的主要资源[24那25那26].探讨所识别的结构多样性EIN3 / EIL.基因,分析这些基因的外显子-内含子结构。如图所示。3.一个,十二个EIN3 / EIL.基因没有包含任何内含子,例如Breil3c.那BoEIL3b, 和Bnaeil4b..12个基因只包含一个内含子,如Breil3a.那BoEIL3a和BnCEIL3b,而剩下的三个基因(Bnaeil3d.那BnCEIL3c和BNCEIL2B.)包含两个内含子。由于含有两个内含子的所有基因在同种异体一种单一中是基因显著,据推测,一些成员EIN3 / EIL.基因家族在多倍体化过程中获得额外的内含子。进一步分析其基因结构是否EIN3 / EIL.基因在多倍体化过程中发生了改变,11对基因(表2)选择最近的遗传距离进行进一步的比较分析。在这些基因中,四对基因具有不同的基因结构,其中三个在其中有三个内含子EIN3 / EIL.同种异体一体块的基因,如Bnaeil3d.那BnCEIL3c和BNCEIL2B.,而另一对基因已经获得了一个内含子(Bnaeil2a.).此外,尽管一对基因(Boeil4b.&BnCEIL4c)具有相同的基因结构,BnCEIL4c与二倍体中的相应基因相比,其显然失去了第二个外显子的一部分B. Oleracea..这些结果表明,在进化期间发生了内含子/外显子收购或损失事件EIN3 / EIL.基因家族在显著,这可能解释了同源基因的功能差异EIN3 / EIL.基因。
接下来,MEME服务器用于在EIN3 / EIL蛋白中找到一些保守的图案(图。3.b).结果发现10个最保守的motif,其中motif 1、5和6均存在于所有EIN3/EIL蛋白中。根据之前的研究,motif 1,6,3和4可能构成EIN3/EILs的保守域[27].值得注意的是,CLADE B中的所有蛋白质包含一个独特的基序7,表明该基序可能具有特殊功能,使这些蛋白质与其他EIN3 / EIL蛋白的功能区分开。此外,大多数密切相关的EIN3 / EIL表现出类似的基序组合物,例如Breil3a&Bnaeil3a,Breil4a&bnaeil4b,Breil2&bnaeil2a,表明它们之间的功能可能非常相似。
艾因3 / EIL蛋白的保守氨基酸和特征分析
进一步评估EIN3 / EIL蛋白序列的身份显著及其二倍体祖细胞,将所有序列排列在一起,并以不同颜色阴影相似或相同的残留物(图。4.).与EIN3 / EIL蛋白的高度保守N-末端序列不同,C末端序列没有显示出显着的相似性,表明这些序列是EIN3 / EIL成员变化的主要来源。拟南芥中所有EIN3 / EIL蛋白的N-末端序列表现出一些结构特征,例如酸性N-末端氨基酸,碱性氨基酸簇和富含脯氨酸的结构域[14].在本研究中,我们鉴定并细化了EIN3/EIL蛋白的四个结构特征显著及其二倍体祖细胞:1)n端高酸性区域(AR);2) 5个保守基本区(BRI-V);3)脯氨酸富区(PR);4)聚asp /Gln (Q/D)区(图4);4.).详细地,N-末端AR主要包括许多ASP(D)和Glu(E)残基。五种BRS,包括Arg(R),Lys(K)和他(H)残留物,分散在EIN3 / EIL蛋白的第一部分。除了四种蛋白质(Breil4b,Bnaeil4d,Boeil4b和bnceil4c)外,PR中的Pro(P)残留物非常保守。富含酸性氨基酸,脯氨酸和谷氨酰胺的地区是一些植物中常见的转录激活域[14那28].因此,EIN3 / EIL蛋白的前半部分的氨基酸组成显著它的二倍体祖细胞展示了转录激活中的作用。
如表所示3.,鉴定的EIN3/EIL蛋白长度范围为192个(bnceei4c) ~ 587个(BnCEIN3 & BnAEIL3a)氨基酸显著.此外,在线分析了所有27艾艾因3 / EIL蛋白的物理和化学性质(表3.),包括分子量(MW),理论上PI,不稳定性指数(II),脂族指数和水下术的宏观平均值(肉汁)。预测的MWS在22.17kDa(BNCeil4c)和66.60kda(Bncein3)之间。显著.通过计算,平均氨基酸数显著(498)低于其二倍体祖细胞(509)和MW显著(56.58kDa)也低于其二倍体祖细胞(57.76kDa)的低。这表明成员EIN3 / EIL.基因家族可能丢失了部分氨基酸序列显著在多倍体化过程中。所有的EIN3/EIL蛋白显著其二倍体祖先的不稳定性指数大于40,表明它们都是不稳定蛋白。所有EIN3/EIL蛋白均为亲水性蛋白,肉汁值均为阴性。在所有EIN3/EIL蛋白中,最短的结构域为155个氨基酸,如BnCEIL4c、BnAEIL4d;最长的结构域为584个氨基酸,如BrEIL3a、BnAEIL3a。中所有EIN3/EIL蛋白的三级结构显著采用同源建模方法(SWISS-MODEL)对其二倍体祖进行预测(附加文件)1:图S1)。结果表明,EIN3/EIL蛋白主要匹配两个模板。一是atin3蛋白dna结合域(DBD)的三维结构(SMTL ID: 4zds.1),由6个α-螺旋和5个短螺旋旋转组成[29].另一种是AtEIL3的DBD (SMTL ID: 1wij.1)的三维结构,由5 α-螺旋组成[8.].
同步和重复基因分析EIN3 / EIL.基因
的同音关系EIN3 / EIL.使用基因组信息分析基因显著(一种N和CN)及其二倍体祖细胞(aR.和CO.),并使用BRAD数据库中的syntenic信息。一共17对EIN3 / EIL.在这些基因组中发现了同期寄生虫和51对同步术(图。5.).观察到十对同步寄生虫显著,每对共线EIN3 / EIL.基因对应于拟南芥中的同源基因。例如,一对同期寄生虫(BnCEIL1a和Bnaeil1b.答案:CN03和A.N分别为03染色体,所有这些染色体都表现出高序列相似之处ateil1.(AT2G27050)。并与同序同源的数量进行了比较EIN3 / EIL.基因的B. Rapa.和B. Oleracea.,在两者之间观察到20个否本质基因B. Rapa.和显著和18之间B. Oleracea.和显著.此外,共发现13对同源基因B. Rapa.和B. Oleracea.,在两个亚基因组中仅发现7对显著,表明一些同步EIN3 / EIL.在多倍化过程中,基因可能会丢失。
大多数重复的基因已经沉默了数百万年,只有几个存活率并进一步探讨了复制事件后的纯化选择[30.].为了获得更多洞察选择性压力是否与之相关EIN3 / EIL.复制事件后的基因,计算10识别的重复基因对计算非同义(KA)和同义替代(KS)值(表4.).根据Ka和Ks的比率,可以推测复制基因的选择压力。Ka / ks = 1的值表明基因经历中性选择,Ka / ks> 1表示阳性选择基因,并且Ka / ks <1显示正在进行纯化选择的基因[31].如表所示4.,来自所有10个基因对的Ka / ks值小于1,表明EIN3 / EIL.基因家族在显著其二倍体祖细胞在复制事件发生后经历了净化选择压力。
分析顺式的推动因素中的作用因素EIN3 / EIL.基因
不同的存在顺式基因启动子的作用元素可能意味着这些基因的功能不同。探索这一点独联体-促进因素中的作用因素EIN3 / EIL.提取基因,提取每种基因的转录起始位点(TSS)上游的1.5 kB基因组序列,然后在PlantCare数据库中搜索[32].如图所示。6., 这独联体-在启动子中负责植物发育和生长、植物激素反应和光响应的作用元件EIN3 / EIL.基因在显著并确定并计算其两个二倍体祖细胞。七独联体- 传递元素与植物开发和生长和其中两个(SKN-1_MOTIF和GCN4_MOTIF相关有关[33与胚乳基因表达有关。大多数(84.6%)的启动子EIN3 / EIL.基因在同种异体情况下含有skn-1_motif显著,而很少有人提倡EIN3 / EIL.基因在二倍体中含有skn-1_motifB. Rapa.和B. Oleracea..猫盒[34], 一种独联体-作用调控元件与分生组织表达有关EIN3 / EIL.基因在显著及其两个二倍体祖细胞。昼夜昼夜控制元素,昼夜人[35],也发现了许多启动子EIN3 / EIL.基因在显著, 如BNCEIL2B.和Bnaeil3a..其余独联体与植物开发和生长相关的元素是玉米醇溶蛋白代谢调节元素(O2-位点)和AS-2-BOX和RY元素[36,这是特定于芽和种子发育的。
对于植物激素与响应相关的独联体- 治疗调节元件,CGTCA-MOTIF和TGACG-MOTIF [37[涉及MEJA响应性是否已被确定EIN3 / EIL.基因启动子显著及其两个二倍体祖细胞。恒生响应元件(TGA元素和辅助核心)[38]和赤霉素响应元件(GARE-motif和P-box) [39也发现了EIN3 / EIL.基因启动子。ABRE [40[分别与脱落酸和水杨酸反应性有关的TCA元素在大多数情况下发现EIN3 / EIL.基因启动子。乙烯响应元件ERE也存在于某些细胞中EIN3 / EIL.基因启动子。此外,Boeil1.其启动子中EREs的数量最大(5)。在所有鉴定的启动子中,共有27个元素与光响应性相关EIN3 / EIL.基因,如Box 4, G-box和gt1基序。值得注意的是,大多数独联体在已识别的内容中观察到的 - 注释的元素EIN3 / EIL.基因启动子显著其两个二倍体祖细胞主要与轻响应性相关。
基因表达模式分析EIN3 / EIL.基因
进一步了解所有标识的表达方式EIN3 / EIL.基于我们的RNA-seq数据(附加文件),研究了它们在四种主要组织(叶、茎、花和角)中的表达模式2:表S1)。总而言之,表达一切EIN3 / EIL.基因在这四种组织中没有组织特异性,表明它们可能在所有这些组织中发挥作用(图。7.).如附加文件所示2:表S1,共6个EIN3 / EIL.基因在选定的组织中未表达。其中,Breil4a.和Breil4b.在所有四种组织中都没有表达B. Rapa.和4个基因(Bnaeil1b.那BnCEIL4a那Bnaeil4b.和Bnaeil4d.)未表示为显著.如图所示。7.,同源基因EIL1在茎中均有明显的高表达显著及其两个二倍体祖细胞。此外,同源基因EIL3有较高的表达水平显著,但在其两个二倍体祖先中表达较低,说明EIL3可能在叶子中发挥更重要的作用显著经过杂交和多倍体化。
调查是否表达式模式EIN3 / EIL.在异源四倍体中,四种组织中的基因发生了变化显著和它的两个二倍体祖先在进化过程中,前面提到的11对基因(表2)的表达模式被分析为可能有进化关系。这些基因对的FPKM值(每千碱基百万的片段数)见表5..相比之下,在基因结构和基因表达模式方面,C3子分层中的基因对高度保守。具体地,C3亚湿地中的所有四个基因对具有相同的基因结构,并且三个基因对的表达模式是一致的。此外,还有一个基因对(Boeil1.和Bnaeil1b.)在表达模式中变化了很大。Boeil1.在所有四种组织中均高表达B. Oleracea.,但Bnaeil1b.在四个组织中没有表达显著.这表明该基因在多倍化过程中可能会发生功能变化。表达的表达也有重大变化Breil3a.和Bnaeil3a.在树叶。Breil3a.在叶子中高度表达B. Oleracea.,但Bnaeil3a.没有用叶子表达显著,表明该基因不再在叶子中发挥重要作用显著.
进一步探讨表达的倾向性EIN3 / EIL.同种异体四倍体的四个组织中的基因显著,我们分析的表达式EIL2那EIL3和EIL4基于FPKM值。一个有趣的现象是,这三个基因的表达倾向于二倍体祖先B. Rapa.在所有四种组织中显著.
讨论
多倍体化是不同物种进化史上的一个常见事件[41],多倍体现象在植物中普遍存在,尤其是被子植物[42].多倍体化后,植物通过一系列基因组变化而不是简单的添加获得一组以上的基因组。集团显著及其二倍体祖细胞(B. Rapa.和B. Oleracea.)适用于多倍体化的研究。此外,EIN3 / EIL.基因家族是一个重要的基因家族和EIN3 / EIL.基因通过参与乙烯信号转导过程来影响植物的生长和发育[10那11].以前的研究EIN3 / EIL.基因家族在杨树和蔷薇科植物中进行了[27那43],而没有关于这个家庭的报道芸苔属植物.因此,我们确定并分析了EIN3 / EIL.异源四倍体的基因家族显著及其二倍体祖先在自然形成期间洞察该基因家族的演变显著.
EIN3 / EIL.基因家族在显著在多倍化期间获得内含子
内含子是真核生物中打断基因编码区域的非编码序列。此外,内含子是真核生物蛋白编码基因的重要标记[44那45那46是基因组适应环境挑战的关键组成部分[47].在这项研究中,一些EIN3 / EIL.基因在显著获得了内含子。统计分析显示,只有一个(EIL3)六(16.7%)EIN3 / EIL.拟南芥基因中包含一个内含子,其余5个基因中没有内含子。42.9和28.6%EIN3 / EIL.基因中含有内含子B. Rapa.和B. Oleracea.,分别。然而,高达77%的EIN3 / EIL.基因中含有内含子显著,这可能会带来一些好处显著.内含子可以保留突变紊乱,从而缓冲来自突变的编码外显子并保护外显子以使基因更加保守[48那49].此外,内含子的存在对生物有一些不同的优点[48那50].首先,内含子可以通过替代剪接或外显子分流增加蛋白质的分集[51那52那53].其次,内含子可以调节基因表达[52]并且一些名为内含子介导的增强(IME)的内含仪也可以促进基因表达[54].第三,内含子可以产生非编码rna参与某些调控过程[55].此外,内含子可以通过获得功能域来增加蛋白质的功能,从而增加蛋白质的多功能性[49].最后,内含子在转录偶联、剪接和mRNA输出等生物学过程中发挥着关键作用[56].当然,相对大量的内含子EIN3 / EIL.基因家族的显著可能为生物带来这些优势,但这种假设需要进一步研究。
同族体的表达EIN3 / EIL.基因在显著偏向于其二倍体祖先B. Rapa.
显著是一种年轻的异源四倍体,仅在约7500年前通过自然杂交和多倍体形成B. Rapa.和B. Oleracea.[22].全基因组测序显著它的二倍体祖先也为我们探索年轻多倍体中的基因家族或亚基因组如何受到影响提供了宝贵的机会。在目前的研究中,没有大规模的基因丢失EIN3 / EIL.基因家族在显著.较低的基因丢失率通常被认为在多倍体形成的早期阶段促进其广泛传播,并有助于其快速多样化[23那42那57那58].事实上,在第一代一些人造/合成四倍体中,染色体DNA和基因损失率可以达到15%[59那60].
的同系物表达式EIN3 / EIL.基因在显著会偏向二倍体祖先吗B. Rapa..一方面,分布EIN3 / EIL.基因组上的基因B. Rapa.和一个次基因组显著都是一样的,除了AR.07-A.N07染色体(图。1).只有少数EIN3 / EIL.基因在C基因组上维持了它们的数量和相对位置B. Oleracea.和c次基因组显著.另一方面,表达偏倚分析表明,可以分析的三个基因(EIL2那EIL3和EIL4)被偏向B. Rapa.在四种组织中(叶、茎、花和角果)。
启动子EIN3 / EIL.基因在显著包含更多独联体-作用成分比它的二倍体祖先
独联体基因启动子区域的作用元件控制着生物体内的基因反应,构成基因复杂调控网络之间的基本功能连接[61].独联体- 传递元素涉及广泛的生物学功能,例如植物生长和发育和激素反应。不同的基因有各类独联体-发挥不同生物功能的作用元素。这EIN3 / EIL.基因启动子区富含独联体杨树中的元素和其中两个(Caat-Box和Tata-Box)都存在EIL.基因[43].这两个元素很常见独联体- 真核基因启动子区域中的元素,桡骨箱形成RNA转录因子的结合位点,并调节基因表达的频率[62[另一个塔塔盒含有一般转录因子或组蛋白的结合位点,并与其结合因素一起参与转录过程[63].在这项研究中,这两个人独联体-作用因素也存在于所有EIN3 / EIL.基因启动子显著和它的二倍体祖先。另外,如图2所示。6., 这独联体表演的元素EIL3 / EIL.根据生物学过程,基因启动子分为三类(植物发育和生长,植物发育,植物激素反应和光反应性)。有趣的是,总数独联体- 在...中的元素EIN3 / EIL.基因启动子显著(373)远远超过其二倍体祖细胞中的元素的总和(235)。进一步的分析表明,植物激素响应中涉及的元素数量EIN3 / EIL.基因启动子显著(99)与其二倍体祖先(95)的元素之和相似。因此,数量上的差异主要存在于独联体- 与植物开发和生长和轻度反应相关的元素。此外,总数独联体-Elements参与植物开发和增长EIN3 / EIL.的倡导者显著在二倍体祖细胞中的2.9倍,光响应元素的数量是二倍体祖细胞的1.8倍。二独联体-Elements显示出显着的差异,即Skn_1主题和盒子I.具体而言,有34个SKN_1主题和16盒IEIN3 / EIL.基因启动子显著,但在两个二倍体祖中只有4个skn_1基序和1个Box I。skn_1基序是a独联体-作用调控元件,是胚乳基因表达所需的调控元件,Box I是光响应元件。因此,数量增加了独联体-ElementsEIN3 / EIL.基因启动子显著可能增强胚乳基因表达和光响应功能。
结论
在这项研究中,13,7和7EIN3 / EIL.在Allotetroploid中鉴定基因显著,AN基因组捐赠者B. Rapa.和C.N基因组捐赠者B. Oleracea.,分别。经过分析,许多成员EIN3 / EIL.基因家族在显著在多倍体化过程中获得内含子,可能会给生物体带来一些好处。此外,EIN3 / EIL.基因在显著偏向于其二倍体祖先B. Rapa.而不是B. Oleracea.,来自基因定位和基因表达的两个方面。此外,启动子EIN3 / EIL.基因在显著包含更多独联体- 与二倍体祖细胞的元素相比,这可能会增强其在胚乳基因表达和光反应性中的功能。简而言之,我们的结果表明了同种异体情况显著在某些生物方面可能具有潜在的优势,这些结果可以增加对展开的理解EIN3 / EIL.基因家族在显著因此,为未来的多倍化研究提供了更多参考。
方法
植物材料
四倍体的种子显著(CV。DARMOR)及其二倍体祖细胞B. Rapa.(简历。Chiifu)和B. Oleracea.(简历。金早生),由中国农业科学院油料作物研究所提供。这些材料在中国武汉的自然条件下生长,并在开花前将花序装袋以防止花粉污染。同时取6个月材料的幼叶、花序茎、开花花和授粉后10天的角果,快速液氮冷冻备用。
鉴定EIN3 / EIL.基因
的基因组数据显著及其两个二倍体祖细胞,B. Rapa.和B. Oleracea.,是从布拉德数据库获得的(http://brassicadB.org/brad/)[64].六种EIN3 / EIL蛋白序列来自答:芥,从TAIR数据库中获取(http://www.arabidopsis.org/),用作对来自这三种物种的所有蛋白质进行BLASTP搜索(E-VALUE <1E-5)的查询。识别EIN3 / EIL.基因三芸苔属植物基因组准确地,通过在NCBI保守域数据库中使用CD搜索(CDD;https://www.ncbi.nlm.nih.gov/cdd.)[65].在本研究中,只有包含完整EIN3/EIL结构域的蛋白才被认为是EIN3/EIL蛋白。最后,确定EIN3 / EIL.基因根据它们的同源关系被手工命名EIN3 / EIL.基因在答:芥.EIN3 / EILS奥雅萨苜蓿那Zea Mays.那Gossypium raimondii.和Populus Trichocarpa.所有物种的基因组数据均来自Phytozome数据库(https:///phytozome.jgi.doe.gov/pz/portal.html.).
染色体定位和基因结构分析
的位置信息EIN3 / EIL.基因在显著其两个二倍体祖细胞从布拉德数据库中收集,并且它们的物理位置被软件MapInspector起草给相应的染色体。外显子/内含子结构EIN3 / EIL.使用基因结构显示服务器(GSDS)2.0进行分析基因(http://gsds.cbi.pku.edu.cn//index.php.)[66].
保守基序及特征分析
通过在线MEME服务器研究了EIN3 / EIL蛋白质中的保守基序(http://meme-suite.org/tools/meme)[67],最大主题编号为10和其他参数作为默认值。此外,艾因3 / EIL蛋白的物理化学特性显著和它的两个二倍体祖细胞通过在线的ExPASy (http://web.expasy.org/protparam/)[68],包括序列长度、分子量(MW)、理论等电点(pI)、不稳定性指数(II)、脂肪指数和亲水性大平均指数(GRAVY)。EIN3/EIL蛋白的三级结构显著采用同源建模方法(SWISS-MODEL, SWISS-MODEL,https://www.swissmodel.expasy.org.).
系统发育关系分析
6个双子体的EIN3/EIL蛋白序列(B. Rapa.那B. Oleracea.那显著那答:芥那Gossypium raimondii.和Populus Trichocarpa.2)和2个单码(奥雅萨苜蓿和Zea Mays.)使用ClustalX对齐。随后,通过分析MEGA 7.0.26构建的最大似然(ML)树推定系统发育关系[69使用1000个引导复制。最后,在线互动生命树(iTOL,http://itol.embl.de/)[70用来装饰这种系统发育树。
基因复制和同步分析
复制EIN3 / EIL.BLASTn利用其编码序列(CDSs)鉴定。两个标准是(a)序列长度> 80%的覆盖率和(b)对齐区域> 80%的同一性[71].采用DnaSP软件(5.10.01版)计算重复的同义(Ks)和非同义(Ka)替换率EIN3 / EIL.基因对[72].然后计算演化约束(Ka/Ks)来分析选择压力。同源基因EIN3 / EILS.在显著它在布拉德数据库中发现了两种二倍体祖细胞,并应用了Circos软件来表达它们之间的同期关系[73].
启动子序列及基因表达分析
启动子序列位于转录起始位点(TSS)上游1500bpEIN3 / EIL.基因,从BRAD数据库中获得独联体使用该植物分析启动子中的-ELEMENT独联体- 处理调节元素(PlantCare)服务器(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)[32].收集植物材料在Illumina Hiseq X-Ten平台上进行转录组测序。确定表达式模式EIN3 / EIL.基因在显著并分析了其两个二倍体祖细胞,四个主要组织(茎,叶,花和单件)的RNA-SEQ数据。FPKM值用于表示基因表达水平。通过Z值归一化FPKM值,通过以下公式计算Z值。\(\ mathrm {z} - \ mathrm {value} = \ frac {\ log 2 \ left(\ mathrm {fpkm} \右) - \ mathrm {mean} \ left(\ log 2 \ left(\ mathrm {FP.K.m}\right)\ \mathrm{of}\ \mathrm{all}\ \mathrm{samples}\right)}{\mathrm{standard}\ \mathrm{deviation}\ \left(\log 2\left(\mathrm{FPKM}\right)\ \mathrm{of}\ \mathrm{all}\ \mathrm{samples}\right)} \).利用Multi Experiment Viewer (MeV;4.9.0)软件版本。
缩写
- 答:芥:
-
拟南芥蒂利亚纳
- 基于“增大化现实”技术:
-
酸性区域
- 显著:
-
芸苔栗鸟
- B. Oleracea.:
-
芸苔属植物oleracea
- B. Rapa.:
-
Brassica Rapa.
- 爆破:
-
基本的局部比对搜索工具
- BRI-V:
-
基本地区I-V
- DBD:
-
dna结合域
- EIN3 / EIL.:
-
乙烯 - 不敏感3 /乙烯 - 不敏感3状
- ERF1:
-
乙烯 - 反应因子1
- 等:
-
乙烯
- FPKM:
-
每公斤百万零件
- 汤:
-
盛大的水平平均水平
- 二:
-
不稳定指数
- 我:
-
Intron-mediated增强
- K a:
-
非同义替代
- ks:
-
同义替代
- ml:
-
最大似然
- MW:
-
分子量
- 公关:
-
脯氨酸区域
- Q / D:
-
ASP / GLN.
- TSS:
-
转录起始点
参考
- 1。
斯特巴斯GL JR.多倍体的类型;他们的分类和意义。adv genet。1947; 1:403-29。
- 2.
奥托SP,Whitton J.多倍体发病率和进化。Annu Rev Genet。2000; 34:401-37。
- 3.
soltis ps,soltis de。杂交在植物形态的作用。Annu Rev植物Biol。2009; 60:561-88。
- 4.
Mayrose I,Barker Ms,Otto SP。染色体数量演化的概率模型及多倍体推断。系统中的生物学。2010; 59:132-44。
- 5.
植物的多倍体和基因组进化。Curr Opin Genet Dev. 2015; 35:119-25。
- 6.
多倍性:范式的陷阱和路径。Am J Bot. 2016; 103:1146-66。
- 7.
杨Z,龚q,秦w,杨z,cheng y,lu l等。旱地棉中WOX基因的基因组分析及其在不同应力下的表达模式。BMC植物BIOL。2017; 17:113。
- 8.
Yamasaki K, Kigawa T, Inoue M, Yamasaki T, Yabuki T, Aoki M,等。主要dna结合区域的溶液结构拟南芥蒂利亚纳ethylene-insensitive3-like3。中华医学杂志。2005;348:253-64。
- 9.
Wawrzynska A,Sirko A.控制和控制:了解通过综合调查EIL蛋白家族的硫磺缺乏症的拟南芥SLIM1功能。前植物SCI。2014; 5:575。
- 10。
Chen YF,Etheridge N,Schaller Ge。乙烯信号转导。Ann Bot。2005; 95:901-15。
- 11.
林泽,钟S,格尔德森D.乙烯研究的最新进展。J Exp Bot。2009; 60:3311-36。
- 12.
abeles fb,摩根pw,盐水植物生物学中的乙烯。第二次。圣地亚哥:学术出版社;1992年。
- 13.
李杰,金wt。对豆豆乙烯不敏感3样蛋白编码的VR-EIL的分子与生化特征。植物理性。2003; 132:1475-88。
- 14.
Chao Q,Rothenberg M,Solano R,Roman G,Terzaghi W,Ecker Jr。核蛋白质乙烯 - 不敏感3和相关蛋白拟南芥乙烯气体反应途径的激活。细胞。1997年; 89:1133-44。
- 15.
Solano R,Stepanova A,Chao Q,Ecker JR。乙烯信号传导中的核事件:由乙烯 - 不敏感3和乙烯 - 反应系数1介导的转录级联。基因开发。1998年; 12:3703-14。
- 16.
烟草的克隆与dna结合特性研究Ethylene-Insensitive3(EIN3)同源物。核酸RES。2000; 28:960-7。
- 17.
Rieu I,Mariani C,Weterings K.五烟草的表达分析EIN3家庭成员与组织特异性乙烯反应有关。J Exp Bot。2003; 54:2239-44。
- 18.
guo h,etcker jr。乙烯信号通路:新见解。CurrOp植物BIOL。2004; 7:40-9。
- 19.
Maruyama-Nakashita A,Nakamura Y,Tohge T,Saito K,Takahashi H. Arabidopsis Slim1是植物硫反应和新陈代谢的中央转录调节因子。植物细胞。2006; 18:3235-51。
- 20.
Wawrzynska A,Lewandowska M,Sirko A. Nicotiana Tabacum EIL2直接调节由硫饥饿诱导的至少一种烟草基因的表达。J Exp Bot。2010; 61:889-900。
- 21.
王旭,王浩,王静,孙锐,吴军,刘胜,等。中多倍体作物品种的基因组Brassica Rapa..Nat麝猫。2011;43:1035-9。
- 22.
王旭东,刘胜,唐华,等。植物遗传学。新石器时代后的早期异源多倍体进化芸苔栗鸟油料基因组。科学。2014;345:950-3。
- 23.
刘树华,刘玉英,杨晓霞,童超,Edwards D, Parkin IA,等。这芸苔属植物oleracea基因组揭示多倍体基因组的不对称进化。Nat Commun。2014;5:3930。
- 24.
Mercereau-Puijalon O,Barale JC,Bischoff E.疟原虫中的三个多尾家族:事实和问题。in j arasitol。2002; 32:1323-44。
- 25.
曹勇,韩勇,孟D,李东,金强,林勇,等。梨III类过氧化物酶基因家族的结构、进化和功能分析Pyrus bretschneideri).前植物SCI。2016; 7:1874。
- 26.
Pellicer J,Hidalgo O,Dodsworth S,Leitch IJ。基因组大小多样性及其对土壤植物演变的影响。基因(巴塞尔)。2018; 9:88。
- 27。
曹勇,韩勇,孟D,李东,金强,林勇,等。基因组分析表明,高水平的微织物和净化选择会影响进化EIN3 / EIL.在蔷薇科的家庭。peerj。2017; 5:E3400。
- 28。
Schwechheimer C,Smith C,Bevan MW。植物细胞中酸性和谷氨酰胺的转录激活域的活性:高水平表达的模块化转录因子设计。植物mol biol。1998年; 36:195-204。
- 29。
宋j,zhu c,zhang x,wen x,liu l,peng j等。拟南芥乙烯断敏3的DNA识别机理生化和结构见解。Plos一个。2015; 10:e0137439。
- 30。
Lynch M, Conery JS。复制基因的进化命运和后果。科学。2000;290:1151-5。
- 31。
唐j,王f,侯x-l,王z,黄z-n。大白菜腕骨转录因子的基因组分级和鉴定(Brassica Rapa.SSP。学报)揭示了非生物和生物应力下的共同性及其表达模式。植物mol biol报告。2014; 32:781-95。
- 32。
Lescot M,Dehais P,Thijs G,Marchal K,Moreau Y,Van de Peer Y等。Plantcare,植物数据库独联体- 在启动子序列中的硅分析中的调节元件和工具的门户。核酸RES。2002; 30:325-7。
- 33。
Bhattacharyya J,Chowdhury Ah,Ray S,Jha JK,Das S,Gayen S等人。水稻本地络合剂促进剂在稳定的转基因水稻植物中提供了增加的组成型表达。植物细胞批准。2012; 31:271-9。
- 34。
张LF,李·米,韩Sy,杨WH,齐LW。日本落叶松平版控制肿瘤蛋白(TCTP)基因体细胞胚胎发生过程中的cDNA克隆,基因组组织及表达分析(Larix Leptolepis.).基因。2013;529:150-8。
- 35。
Anderson SL, Teakle GR, Martino-Catt SJ, Kay SA。生物钟和光敏色素调节的转录被授予78 bp独联体拟南芥CAB2启动子的-作用域。植物j . 1994; 6:457 - 70。
- 36.
Bobb AJ,Chern Ms,Busters mm。保守的Ry-重复通过发育调节剂PVALF介导种子特异性启动子的转移。核酸RES。1997年; 25:641-7。
- 37.
Rouster J,Leah R,Mundy J,Cameron-Mills V.鉴定A的启动子中的己酸酯响应区域脂氧合酶1在大麦粒中表达的基因。植物j . 1997; 11:513-23。
- 38.
Ulmasov T,Murfett J,Hagen G,Guilfoyle TJ。Aux / IAA蛋白抑制了含有天然和高活性合成的植物响应元素的报告基因的表达。植物细胞。1997; 9:1963-71。
- 39.
Kim JK,Cao J,Wu R.多种蛋白因子与水稻高PIα-淀粉酶基因近端启动子区的调节与相互作用。Mol Gen Genomics。1992年; 232:383-93。
- 40.
沉Q,豪了。脱离酸(ABA) - 剩余基因的功能疏散揭示了两个独立的ABA响应络合物,每个含有G盒和新颖独联体表演元素。植物细胞。1995;7:295 - 307。
- 41.
Burgess DJ。进化:多倍体收益。NAT Rev Genet。2015; 16:196。
- 42.
焦友,Wikeett NJ,Ayyampalayam S,Chanderbali As,Landerr L,Ralph Pe等。种子植物和贪眼的祖先多倍体。自然。2011; 473:97-100。
- 43.
Filiz E,Vatansever R,Ozyigit II,Uras Me,Sen U等。基因组识别和表达剖析EIL.在木本植物代表杨树的基因家庭(Populus Trichocarpa.).拱生物学生生物糖。2017; 627:30-45。
- 44.
Lamond Ai。在RNA周围跑环。自然。1999; 397:655-6。
- 45.
内含子丢失和获得的比率:对早期真核生物进化的影响。美国国家科学研究院2005;102:5773-8。
- 46.
Rodriguez-Trelles F, Tarrio R, Ayala FJ。剪接体内含子的起源与进化。Annu Rev Genet. 2006; 40:47-76。
- 47.
Jeffares DC,Penkett CJ,巴勒J.快速调节基因是内含子贫困。趋势类型。2008; 24:375-8。
- 48.
jo bs,choi ss。内含子:内含子在基因组中的功能益处。基因组学通知。2015; 13:112-8。
- 49.
Mukherjee D,Saha D,Acharya D,Mukherjee A,Chakraborty S,Ghosh TC。内含子在守恒代谢基因中的作用拟南芥蒂利亚纳.基因组学。2018;110:310-7。
- 50。
Chorev M,Carmel L.内含子的功能。前群体。2012; 3:55。
- 51。
Kalsotra A,Cooper Ta。作者:王莹,王莹,王莹,王莹NAT Rev Genet。2011; 12:715-29。
- 52。
杨云飞,朱婷,牛DK。拟南芥内含子丢失与高突变率的关联:对基因组大小进化的启示。基因组生物学进展。2013;5:723-33。
- 53。
Gorlova O, Fedorov A, Logothetis C, Amos C, Gorlov I.内含子负担大的基因在蛋白质水平上表现出更大的进化保守性。BMC Evol Biol. 2014;14:50。
- 54。
睫毛膏地区,梅特勒IJ,Pierce Da,Lowe HW。内含子介导的玉米异源基因表达的增强。植物mol biol。1990; 15:913-20。
- 55。
应树,林淑玲。内含子microRNAs。生物化学学报。2005;326:515-20。
- 56。
基因表达机之间的广泛耦合网络。大自然。2002;416:499 - 506。
- 57。
郭华,金东东,郭洪波,等。重复多倍化Gossypium基因组和可纺棉纤维的演化。自然。2012; 492:423-7。
- 58。
Woodhouse Mr,Cheng F,Pires JC,Lisch D,Freeling M,Wang X.原因,遗传和基因对多倍体统治性的基因组优势的影响。Proc Natl Acad Sci U S A. 2014; 111:5283-8。
- 59。
Ozkan H,Levy AA,Feldman M. AllopolyPloidy诱导小麦的快速基因组进化(Aegilops-triticum)组。植物细胞。2001;13:1735-47。
- 60.
Ozkan H,levy AA,Feldman M.新形成的全多倍麦麦芽族仿染色体的快速分化。ISR J PLSNT SCI。2002; 50:S65-76。
- 61.
Nuruzzaman M,Sharoni Am,Satoh K,Kumar A,Leung H,Kikuchi S.比较转录组简介WRKY在控制、激素处理和干旱条件下,近等基因水稻系的基因家族揭示了不同的组织特异性基因激活。acta botanica yunnanica(云南植物研究),2014;
- 62.
Laloum T,De Mita S,Gamas P,Baudin M,Niebel A. CCAAT-Box在植物中的结合转录因子:Y这么多?趋势植物SCI。2013; 18:157-66。
- 63.
BAE SH,HAN HW,Moon J.含塔塔盒基因和必需基因的分子相互作用的功能分析。Plos一个。2015; 10:E0120848。
- 64.
程飞,刘胜,吴建军,方磊,孙胜,刘波,等。BRAD的遗传学和基因组数据库芸苔属植物植物。BMC植物BIOL。2011; 11:136。
- 65.
韩立平,何建平,李春华,等。CDD/SPARCLE:通过亚家族结构结构对蛋白质进行功能分类。5: D200-d203。
- 66.
胡b,金j,guo a-y,张h,罗j,高g. gsds 2.0:升级的基因功能可视化服务器。生物信息学。2015; 31:1296-7。
- 67.
贝利,博登,布斯克,弗里斯,格兰特,克莱门提,等。MEME套件:motif发现和搜索工具。核酸Res. 2009;37: W202-8。
- 68.
Artimo P,Jonnalgega M,Arnold K,Baratin D,Csardi G,De Castro E等人。Expasy:SIB生物信息学资源门户。核酸RES。2012; 40:W597-603。
- 69.
MEGA7:用于更大数据集的分子进化遗传学分析7.0版本。Mol Biol Evol. 2016; 33:1870-4。
- 70。
Leatunic I,Bork P.互动生活树(ITOL)V3:用于显示和诠释系统发育和其他树木的在线工具。核酸RES。2016; 44:W242-5。
- 71。
kong x,lv w,姜s,张d,cai g,pan j等。玉米钙依赖性蛋白激酶的基因组鉴定及表达分析。BMC基因组学。2013; 14:433。
- 72。
Librado P,Rozas J.DNASP V5:一种用于综合分析DNA多态性数据的软件。生物信息学。2009; 25:1451-2。
- 73。
王志强,王志强,王志强,等。Circos:比较基因组学的信息美学。基因组研究》2009;19:1639-45。
致谢
不适用。
资金
该工作得到了中国国家自然科学基金(31570539,31370258)的支持。
可用性数据和材料
本研究期间生成或分析的所有数据都包含在本发布的文章和附加文件中。
作者信息
从属关系
贡献
JW和ML构思并设计了这项研究。ML进行生物信息学分析。ML写了手稿。XW提供了实验材料。ML、RW、ZL负责种植材料。所有作者阅读并批准了最终的手稿。
通讯作者
道德声明
伦理批准和同意参与
不适用。
同意出版物
不适用。
利益争夺
两位作者宣称他们没有相互竞争的利益。
出版商的注意事项
Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。
附加文件
附加文件1:
图S1。所有EIN3 / EIL蛋白的预测三级结构显著和它的二倍体祖先。Bncein3的预测结构(一种).BnAEIL1b、BnCEIL1a、BoEIL1和BrEIL1的预测结构(B.).BNCEIL2B和BOEIL2B的预测结构(C).BnAEIL2a的预测结构(D.).Boeil2a的预测结构(E.).预测的BrEIL2 (F).BnAEIL3d、BoEIL3b和BrEIL3c的预测结构(G).BNCEIL3B和BOEIL3A的预测结构(H).BNCEIL3C的预测结构(一世).Breil3b的预测结构(j).BnAEIL4b、BnCEIL4a和BoEIL4a的预测结构(K.).Bnaeil4d和Breil4b的预测结构(L.).Boeil4b的预测结构(m).Bnaeil3a和Breil3a的预测结构(N).BnCEIL4c (O.).BrEIL4a (P.).(TIF 6803 KB)
附加文件2:
表S1。所确定的FPKM值EIN3 / EIL.四个主要组织中的基因显著及其二倍体祖细胞(B. Rapa.和B. Oleracea.).(XLSX 15 kb)
权利和权限
开放获取本文遵循知识共享署名4.0国际许可协议(http://creativecommons.org/licenses/by/4.0/)如果您向原始作者和源给出适当的信用,则允许在任何介质中进行不受限制的使用,分发和再现,提供指向Creative Commons许可证的链接,并指示是否进行了更改。Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)除非另有说明,否则适用于本文中提供的数据。
关于这篇文章
引用这篇文章
李,M.,Wang,R.,Liang,Z.et al。基因组 - 范围识别和分析EIN3 / EIL.异种情况下的基因家族芸苔栗鸟在多倍化期间揭示其潜在的优势。BMC植物杂志19,110(2019)。https://doi.org/10.1186/s12870-019-1716-z.
已收到:
公认:
发表:
关键字
- EIN3 / EIL.基因家族
- 独联体-元素
- 内含子
- Allotetraploid.
- 芸苔栗鸟
- 多倍化