跳转到主要内容

基因组 - 范围识别和功能表征LEA亚麻种子发育过程中的基因(亚麻属植物usitatissimuml .)

抽象的

背景

Lea蛋白广泛分布在植物和动物王国以及微生物中。LEA基因组成一个大家族,在植物抵御各种不利条件方面发挥作用。

结果

采用生物信息学方法进行鉴定LEA亚麻基因组中的基因。总共有50个LEA基因组中的基因。我们还对基因的物理化学参数和亚细胞位置进行了分析并产生了系统发育树。Lulea.在15个亚麻染色体中不均匀地映射基因,90%的基因具有少于两个内含子。表达概况Lulea.表明最多Lulea.基因在种子发育后期表达。在功能上,Lulea1.基因降低了种子大小和脂肪酸含量Lulea1.-overex抑中的转基因拟南芥线条。

结论

我们的研究增加了有价值的知识LEA亚麻中的基因可用于改善种子发育的相关基因。

同行评审报告

背景

晚期胚胎发生丰富(LEA)蛋白广泛存在于生物体的多种组织中[12].这些蛋白质已经在细菌中观察到,蓝藻细菌[3.,真菌和动物[13.]但是1981年由研究人员在成熟的棉花种子中发现了[4.].顾名思义,该蛋白质在种子成熟后期累积。随后发现鉴定了其他植物中的蛋白质,例如米饭,拟南芥、玉米(15.6.], 等等。 [7.8.9.].在植物中,LEA在许多不同的组织中表达基因,例如种子,根,茎和芽[10.],因此它们的潜在功能不仅限于种子发展的过程。科学家们已经发现,当细胞在应力下,特别是干旱和干燥时,可以诱导lea蛋白以表达和用作蛋白质和膜的保护剂,以独特的方式。大多数Lea蛋白是低重量分子,大小为10至30kd。

根据不同的标准鉴定了lea蛋白的几种分类。广泛采用的分类将LEA蛋白分为八个亚组:lea_1,lea_2,lea_3,lea_4,lea_5,lea_6,脱氢和种子成熟蛋白(SMP)。此分类基于PFAM数据库中可用的序列同源性和保守的主题[25.].在八个lea亚组中,除了lea_2,lea_3和smp子组中有一些非典型疏水蛋白[11.],其中精氨酸/赖氨酸(Arg/Lys)、谷氨酸(Glu)、Ala、苏氨酸(Thr)和甘氨酸(Gly)含量高[12.].所有脱氢蛋白均具有富含赖氨酸的K段,并且有些甚至具有Y段或S段。这些段可以以串联重复的形式存在[13.].与其他蛋白质不同,大多数具有本质无序蛋白质(IDPS)的Lea蛋白没有三维结构[14.15.],符合他们的高亲水性。

种子发育是被子植物生命周期的重要组成部分,它受到一个庞大而复杂的网络的调控,包括转录、表观基因、激素、多肽和糖信号调节因子[16.].通常,种子发育可以大致分为两个阶段,形态发生和成熟[17.].在后期,LEA蛋白的强表达被认为是种子成熟的明确标志[18.19.].以前的研究表明,Lea蛋白可能与种子寿命,干燥耐受性和活力有关[20.21.22.23.].通过含有ABI3,ABI4,ABI5,EEL和DOG1的转录因子网络调节Lea蛋白的子集,如Lea转录物的下调所证明的Abi3, abi5,叶状子叶1Fusca3.突变体[18.24.].转录因子LEC1,FUSCA3和ABI3参与种子中的脂肪酸生物合成和脂质储存[25.].然而,很少的证据表明Lea蛋白直接或间接控制种子性状。这可能是因为大多数研究一直专注于Lea蛋白对干旱,热,冷和其他非生物应激的耐受性的贡献[19.26.].据我们所知,只有梁等人。(2019)证明过度表达lea3.拟南芥芸苔栗鸟提高种子、种子重量和含油量[27.].总的来说,我们对LEA蛋白如何参与种子发育和脂质调节网络的了解仍有许多空白需要填补。此外,LEA蛋白在每个亚家族中表现出不同的功能,因此这些潜在的功能是需要填补的额外知识空白。

随着快速测序技术的发展,越来越多的植物基因组信息已经可用。在过去的20年中,许多Lea蛋白已在不同的植物物种中鉴定,包括稻米[6.],答:芥[5.],玉米[28.],显著[29.],高粱[30.,西瓜7.]和小麦(Triticum aestivum.)[31.].此外,研究报告大多数植物物种中的Lea蛋白有许多成员,例如,成员的数量是51一、芥[5.],108 in显著[29.和281种小麦[32.];相对较高的数量反映了它们在植物中的显着作用。然而,仍然未知是大多数Lea基因的精确功能。

亚麻(亚麻属植物usitatissimumL.),一个自我授粉的年度草本植物,历史悠久的驯化历史8000年,起源于中东,现在广泛分布在世界各地[33.].亚麻根据其利用率分为纤维亚麻和亚麻籽亚麻两种类型。目前亚麻仁品种种子中油脂含量可累积到50%以上,大部分脂肪酸由棕榈酸(PAL;C16:0, ~ 6%),硬脂酸(STE;C18:0, ~ 2.5%)、油酸(OLE;C18:1,~ 19%)、亚油酸(LIO;C18:2, ~ 13%)和亚麻酸(LIN;C18:3, ~ 55%) [34.].与大多数含油作物不同,亚麻籽含有多样性的氨基酸和维生素,以及更高水平的不饱和脂肪酸,特别是α-亚麻酸(ALA),其占亚麻中不饱和脂肪酸的64%籽油 [35.].脂肪酸ALA及其转化如DHA(Docosahehiooc酸),EPA(eicosapntemacnioc酸)极大地利用人员保健。

因为亚麻的基因组序列可用于研究[36.,研究人员更容易识别LEA亚麻的基因。在这项研究中,几个Lulea.在亚麻基因组中鉴定出基因。基因结构和系统发育分析表明,这些基因可分为8个亚群。此外,我们还测定了种子发育过程中的基因表达水平。最后,从Lulea.我们选择了一个在成熟后期大量表达的基因LEA基因,Lulea1.,变成拟南芥.这Lulea1.与WT(野生型)中的那些产生尺寸和脂肪酸内容物的种子减少的-Over-Expression系。我们的结果不仅有助于提高亚麻基因组中LEA系列的理解,还提供对LEA功能的见解,其功能与亚麻中的油代谢相关。

结果

鉴定Lulea.亚麻基因组中的基因家族

结合局部BLAST方法与HMM方法,50Lulea.基因成员LEA鉴定亚麻基因组(表1).这些基因被命名为Lulea1.Lulea50..基于序列同源性和pam数据库中的保守基序,这些Lulea.基因分为LuLEA_1、LuLEA_2、LuLEA_3、LuLEA_4、LuLEA_5、LuLEA_6、脱氢酶和SMP亚家族。在所有亚家族中,脱氢酶亚家族的基因数最高,为10。其次是LuLEA_1、LuLEA_2、LuLEA_3亚家族,分别有9、8、8个基因。最小的亚家族为LuLEA_4和LuLEA_6,各有2个基因成员。

表1LEA亚麻基因组中的基因及其序列特征和理化参数

根据染色体位置Lulea.在NCBI数据库中,我们得到了49个基因的分布谱Lulea.分析基因(补充图。1).很明显,染色体1的数量最多Lulea.最多14的基因。其他染色体少于6Lulea.基因。除LuLEA_6和LuSMP亚家族外,其他亚家族有1 ~ 3个成员位于1号染色体上。我们进一步绘制了亚麻的其他14条染色体图谱,发现它们有1到6条染色体Lulea.基因。例如,CHR4,CHR5和CHR7只有一个LEA每条染色体上的基因,而CHR11,CHR12,CHR13和CHR15有两个LEA每条染色体上的基因(补充图。1).

这50的物理化学参数Lulea.使用扩展基因获得基因。除了一个基因片段(Lulea17.),长14,123 bpLulea.基因片段从165 bp(Lulea32.)到1708年BP(Lulea46.).大多数成员编码的氨基酸少于300个。同一子组的成员显示了相似的特性。例如,作为LuLEA_4组的成员,两者都是Lulea26.(398 AA)和Lulea27.(497 aa)编码大量氨基酸,而LuLEA_3组(Lulea18-Lulea25)编码相对较少的氨基酸,范围从81 - 109 aa。同样地,分子质量与氨基酸数目具有相同的模式。约有三分之二的LuLEA蛋白具有较低的等电点(pI < 7),包括LuLEA_2、LuLEA_4、LuLEA_5、LuLEA_6和LuSMP亚家族的所有蛋白和部分脱氢蛋白。其中LuLEA_1和LuLEA_3亚家族均有pI > 7,而LuLEA41和LuLEA42在脱氢蛋白亚家族中也有pI > 7。1 / 10的LuLEA蛋白具有较高的总平均亲水性(肉汁> 0),所有这些蛋白都属于LuLEA_2亚家族。结果表明,大部分LuLEA蛋白具有亲水性,其中LuLEA_5蛋白的亲水性最强,而LuLEA_2蛋白的疏水性最强,这与非典型的观点一致。亚细胞定位预测显示近80%的LuLEA蛋白位于细胞核。只有LuLEA_1亚家族的LuLEA6蛋白被预测有很高的可能定位于质膜。有趣的是,一半的LuLEA_3蛋白可能在叶绿体中发现,另一半可能在线粒体中发现。此外,LuLEA11蛋白也被预测在叶绿体中,所有带有LuLEA2的LuLEA_6蛋白可能都分布在细胞外空间(Supplementary Table)1).

生物进化与基因结构分析Lulea.基因

调查所识别的同源性和相似性Lulea.对所有LuLEA蛋白序列进行比对,构建无根系统发育树(图1)。1).这些基因分为八个主要的片状,胃膜蛋白序列的八个亚颗粒共享非常低的相似性。相比之下,在分支末端配对的相当数量的蛋白质之间观察到高相似性,例如Lulea1和Lulea4,Lulea12和Lulea16,Lulea35和Lulea37,这表明仍然是一个属于同一亚家族的Lulea成员现有的公平同源性。

图。1
图1

系统发育分析Lulea.亚麻的基因。Lulea.基因家庭被不同颜色分组。使用CLUSTALW在MEGA6软件中使用50个露珠蛋白的全长氨基酸序列产生直接的树。

在遗传序列中的外显子和内含子的分布Lulea.基因如图所示。2.大约所有长于400 bp的基因都包含外显子和内含子。这些缺失内含子的基因分布在LuLEA_2、LuLEA_3和LuLEA_4三个亚家族中。大多数有内含子的基因只有一个内含子。同样值得注意的是Lulea17.将其分组到Lulea_2亚家族中,其长度比任何其他基因最长,最高可达14kb,并且它也具有最大的内含子(4)和外显子(5)。此外,最长的内含子Lulea17.长度长达10千克。

图2
图2.

外显子和内含子的分布Lulea.基因。彩色盒子代表外显子,灰色线表示内含子。Lea Subfamilies通过颜色来区分。外显子和内含子的长度和位置Lulea.基因由底部的鳞片表示

除了基因序列结构分析之外,分析了每种蛋白质序列的基序的分布(图。3.).将50条LuLEA蛋白序列提交给MEME工具,以确定其基序特征。总的来说,每个亚科有1 ~ 3个基序,亚科之间的基序差异很大(图1)。3.).LEA_4和LEA_6亚家族与其他亚家族共有的基序太少,未被显示在结果中。然而,在同一亚科成员的数量和类型上有很大的相似性,这反映了系统发育分析的可靠性。值得注意的是,脱氢蛋白亚家族具有大量的保守亲水性氨基酸,如G(甘氨酸)和K(赖氨酸),这意味着一个亲水性亚家族的特征。

图3.
图3.

图案的分布Lulea.基因和保守的氨基酸在通过Weblogo Plot表现出的每种亚家族中。不同的图案是由不同颜色的盒子区分的。每个序列中的最大图案数设置为10.每个亚家族的代表主题在右侧显示

基因表达模式分析Lulea.种子发育阶段的基因

表达模式显示几乎所有的Lulea.在整个种子发育的所有阶段表达基因,我们的亚麻栽培品种,Heiya No.14和Macbeth。在Heiya第14号,共42岁Lulea.基因表达在所有阶段,44Lulea.在麦克白中表达的基因。在比较这两个品种之间的常见表达基因,我们发现36Lulea.基因在5天,10天,20天30天授粉后(DAP);在种子发育的第30天表达一个基因。另外,还有一种在麦克白的第10天表达但不在Heiya No.14中表达的一种基因,这意味着两种亚麻栽培品种之间的另一个差异(图。4.A-B)。

图4.
装具

表达概况Lulea.亚麻种子发育中的基因家族。一种在授粉后5,10,20和30天表示的品种Heiya的共享和非共用数量的Venn图;B.如同一种但是麦克白的品种;C相对比Lulea.种子成熟过程中每种亚家族的基因表达水平。蓝色色调代表较低的表达水平,红颜色色调代表更高的级别

为了确认LEA亚家族成员间的表达模式差异,我们制作了单个亚家族的热图。最流行的趋势Lulea.黑牙14号与麦克白号基因表达水平一致。一些Lulea.基因,如Lulea1.Lulea2.Lulea41.,倾向于在种子发展的后期高度表达。相反,表达了几个Lulea.基因,如Lulea15.Lulea38,Lulea43,从早期到延迟发展阶段下降。五个主要的基因Lulea.LuLEA_1、LuLEA_4-LuLEA_6和LuSMP亚家族表达模式相似。中发现了一个异常Lulea32.在我们四个采样期间高度表达的这种基因。在五个亚壳中的其余基因在第20天和30天具有较大的表达表达增加(图。4.C)。

Lulea1.是负责种子发育和脂肪酸代谢吗

产生并分析了两个名为Lulea1-6和Lulea1-7的独立过度表达线。与WT植物的植物相比,两条过度表达系中的两种具有显着较低的测量种子性状性状,种子重量,面积和周长的值。结果表明Lulea1.可能在调节种子尺寸方面发挥作用(图。5.A-C)。

图5.
figure5

的影响Lulea1.转基因中的种子大小和脂肪酸含量拟南芥线条。一种在“正常”条件下的转基因刘南1线和野生型的1000种种子重量;B.转基因和WT种子的平均面积;C转基因和WT种子的平均圆周。D.过表达线的总脂肪酸含量和野生型在“正常”条件下种植;E.10种脂肪酸成分在过表达线和野生型中生长在“正常”条件下;F各脂肪酸成分的比例。数据代表了至少3次重复的平均值和标准偏差(STD)。通过双尾配对Student’s t检验,将转基因数据与在相同条件下生长的植物的WT数据进行比较,确定有统计学意义的差异。*P.< 0.05;Arunachal Pradesh,P. < 0.01

进一步探索是否Lulea1.在种子发育过程中控制脂肪酸代谢的作用,转基因中的脂肪酸含量拟南芥通过GC-MS(气相色谱 - 质谱仪)测定线。两条过度表达线的总平均脂肪酸含量小于WT的总脂肪酸含量小于WT,并且Lulea1-6显着降低。同时,转基因系的不同类型脂肪酸的大多数含量低于WT的脂肪酸,C18:0,C18:3,C20:1和C20:3的含量明显减少。此外,我们发现每种脂肪酸的比例也不同。转基因系中C18:1和C18:2的比例显着较高,而C18:3和C20:1的比例低于wt。这些结果表明Lulea1.可以阻止C18:1和C18:2的转化过程中C18:3和C20:1(图。5.d-f)。

讨论

Lea Gene家族是一个大而复杂的家庭,拥有许多属于不同亚属的成员。Lea系列中的基因已在许多作物中发现,例如米饭,答:芥和小麦。除了在植物中,这个基因家族已经在动物和微生物中被报道。然而,亚麻LEA蛋白家族的特性和鉴定尚未见报道。在这项研究中,50LEA在亚麻基因组中鉴定基因,几乎等于51LEA基因中发现答:芥.假定亚麻是二倍体(2n = 30),且数量Lulea.接近这一点答:芥,整个基因组复制事件LEA在亚麻中发生的基因是值得怀疑的,并得到许多进化保护的结果LEA基因[22.29.].因此,很容易推断出LEA必须在生物体的发展中发挥至关重要的作用。

50LEA亚麻中的基因分为八个亚属。在亚属中,脱氢素亚家族具有最多的基因,10,在朱雷家族中,而Lulea_6亚家族具有最少的2.分布lea_6.dehydrin亚麻中的基因与那些相似答:芥.从多种植物物种比较,虽然有些人在很大程度上占据了lea_4亚家族或lea_2 subfamilies,例如答:芥显著, 棉布 (陆地棉)、茶叶(茶树),脱氢亚家族倾向于分享相当大的部分,这意味着脱氢丁相对保守并且可能在进化期间对细胞提供更稳定的保护。证据表明,在藻类和水稻基因组中未发现lea_6亚家族[6.22.]这表明lea_6从其他古代Lea基因延伸,并且可能为努力努力造成努力。

根据我们的结果,五Lulea_2.基因可能编码疏水性蛋白质,而其他基因是亲水蛋白质。这种结果与过去研究的结果一致答:芥Populus Trichocarpa.,Solanum Tuberosum.lea_2.基因被认为是异源的其他亚家族LEA可以解释lea_2亚家族中的成员报告的独特结构,非典型人物甚至新函数的基因[3.].

在亚麻,lea_2.基因可能只存在于叶绿体和线粒体中,这表明lea_2.可以在这些特定细胞细胞器中保护蛋白质的作用。核和细胞质中还有一些胃蛋白质以及细胞质膜。这些结果表明,Lea蛋白广泛分布在细胞内,因此这些蛋白质具有重要作用,例如在压力条件下保护细胞室的保护并不是没有载体。此外,我们的大多数鉴定的胃膜蛋白根据其肉汁值是亲水性的,其与其他高等植物中的Lea蛋白确定的表征非常相似[5.9.29.].许多研究表明,高亲水性的性状可归因于Lea蛋白中的IDPS的存在,并且高亲水性促进其潜在的功能作为蛋白质和膜保护剂和分子伴侣,以确保各种不利环境中的细胞生存。

含有内含子和外显子的基因结构的地图显然显示了大量的Lulea.基因内含子少于2个,基因长度相对较短。先前的一项研究表明,与应激反应相关的基因只有很少的内含子[37.,这得到了我们的研究结果的支持。的报道很多LEA其他植物物种中有少数内含子的基因也证实了这一点。在显著,16/108BNLEA.基因没有内含子,并且亚家族Bnlea_6有五个成员,每个成员只有一个内含子[29.].在小麦中占62%LEA基因没有内含子[32.].在答:芥,其66.7%LEA基因只包含一个内含子[5.].此外,在其他已知参与应激反应的基因中也发现了类似的低内含子数量的结论。例如,大多数StHsp20没有或只有一种内含子的基因(89.6%)对多种非生物应激作出反应[38.].在另一个例子中,编码植物发育和非生物应激反应中的转录因子的高百分比(83.9%)的锌手指同源域基因显著缺少内含子(39.].从生物分子活性的角度来看,转录后,内含子会被剪接出最终的序列。减少基因的内含子有利于加快基因从转录到表达的过程,便于细胞对非生物胁迫做出反应,降低转录成本[40].

不同的LuLEA亚家族具有不同的基序分布。同一亚科的蛋白质具有相似数量和类型的基序,系统发育树显示了这一点。这些特征可能暗示了LEA蛋白具有多种功能的原因。

在大多数情况下,基因表达分析可以帮助揭示靶基因的重要功能。根据的表达模式Lulea.在DAP的5、10、20和30个位点,只有6个Lulea.在亚麻籽成熟期间,基因缺乏表达,而在整个过程中表达的其他基因。这些观察结果表明,这些基因在种子成熟过程中发挥着重要作用。另外,在几种亚壳中的成员的表达,例如Lulea_1,Lulea_4〜Lulea_6和LUSMP,其在晚期成熟中积累,这与先前研究的报告的数据一致[18.19.26.].这些Lulea.推测基因在种子成熟和干燥过程中起着重要作用。与此同时,一些Lulea.基因,如Lulea_3.Ludehydrin似乎没有明显的规律性,这可以解释Lea蛋白的潜在功能和与各种结构的相关性的多样性。

过去的研究表明LEA基因参与种子发育的调控网络[18.]因此,我们研究了由此产生的种子的表型Lulea1.-OVERExpressing转基因拟南芥.种子质量、面积和周长等性状均有所降低。此外,种子中脂肪酸含量也有所下降。由此推断,LEA_1基因亚家族负调控种子大小和脂肪酸含量。有趣的是,Liang等人[27.]表现出相反的结果:过表达属于lea_4亚家族的基因,BNLEA3.,可增加种子大小和种子含油量拟南芥.但是,没有证据表明直接参与的证据LEA种子大小和石油合成调节机制的基因。基于现有发现,Lea蛋白受转录因子ABI3,ABI4,ABI5进行调节[18.]并且还显示出这些因素影响种子大小和脂质生物合成[23.4142].因此,Lea蛋白可能具有与这些转录因子的反馈关系,不同的Lea家族可能具有赋予其不同亚属赋予的对比函数,以在集体保护植物中保持函数之间的平衡。

结论

在这项研究中,共有50个LEA在亚麻基因组中鉴定基因,基于保守的结构域分为八个亚壳。来自同一亚家族的基因具有相似的结构,其也得到了系统发育分析结果的支持。全部Lulea.基因分布在每条染色体上。过度表达Lulea1.拟南芥减少种子重量和尺寸的特征,以及脂肪酸含量。

方法

鉴定LEA基因组织在亚麻基因组中

51LEA基因序列答:芥从数据库TAIR检索(拟南芥信息资源,https://www.arabidopsis.org/),然后使用从基因组数据库植物血红素血红素中获得的亚麻蛋白序列喷射(https://phytozome.jgi.doe.gov/pz/portal.html#!info?alias=Org_Lusitatissimum).我们也使用了pam数据库(https://pfam.xfam.org/search)和Hmmer以保守的Lea结构域寻找基因[43].用Hmmer结合爆炸,在过滤错配或冗余基因后获得亚麻的初始候选Lea基因。三个网站工具,CDD(保守域数据库,https://www.ncbi.nlm.nih.gov/cdd/),pfam和smart(https://smart.embl-heidelberg.de/smart/set_mode.cgi?normal=1)用于确认并确保所有候选基因都包含Lea系列领域。最终过滤基因以编号顺序分配新名称。

氨基酸的数量和基因的长度是通过Phytozome网站(https://phytozome.jgi.doe.gov/pz/portal.html)和染色体位置Lulea.基因来自NCBI数据库(国家生物技术信息中心,https://www.ncbi.nlm.nih.gov/).通过扩展来计算每个Lulea蛋白的分子量(KDA),肉汁(水疗法的宏大),肉汁(水碎片)和PI(异电点)和PI(等电点)的物理化学参数进行了扩展(www.expasy.org/tools/).利用BUSCA注释系统(https://busca.biocomp.unibo.it/).

LuLEA家族成员的系统发育和序列特征分析

使用ClustalW对50个LuLEA蛋白序列进行多序列比对[44,利用MEGA7软件构建系统发育树[45].采用最大可能性的方法来构建树,并且它具有1000个引导复制。了解的结构特征Lulea.基因检查含有外显子和内含子的遗传序列,测定每个蛋白质序列上的基序的分布。由于每个序列之间的变化,将每个基因的基序的最大值设定为10.在基因结构分析中Lulea.基因仅限于亚麻注释,UTRS(未转换区域)无法显示。内含子和外显子片段的分布Lulea.通过基因结构显示服务器的帮助,通过图表来可视化基因(https://gsds.cbi.pku.edu.cn/).通过的保守氨基酸基序的相对位置Lulea.使用Motif Elicitation工具Multiple Expectation Maximization (https://alternate.meme-suite.org/).染色体的位置Lulea.基因来源于NCBI网站上的位置信息。用MG2C (https://mg2c.iask.in/mg2c_v2.0/).

开发种子样品的RNA提取和RNA测序

亚麻栽培品种Heiya第14号[46]和麦克白作为植物标本采集和RNA分离的材料。黑亚14号是为了提高亚麻纤维的品质和产量而选育的,其种子含油量约占种子重的25%。麦克白是一种油籽亚麻,产生约40%的种子含油量以及大种子大小。在24°C和16小时日光/8小时暗周期的“正常”生长条件下,植物生长在温室中。授粉后第5天(DAP5)、10天(DAP10)、20天(DAP20)和30天(DAP30)采集球果,立即用液氮冷冻,然后提取RNA。每个样本准备2个重复,用于构建测序文库。总RNA用TRIzol试剂(Invitrogen, 15596 - 026)分离,按照制造商的说明。然后构建cDNA文库并进行检测。基于合成测序技术,利用Illumina HiSeq 2500平台进行cDNA文库测序,获得大量高质量数据。

基因表达模式分析Lulea.具有RNA-SEQ数据的基因系列

我们使用RNA-seq数据分析基因表达模式Lulea.基因。对测序后的原始数据进行过滤后,将干净数据映射到亚麻参考基因组(https://phytozome.jgi.doe.gov/pz/portal.html).然后,FPKM (Fragments per Kilobase of Exon per Million Fragments Mapped)方法[47应用基于映射到参考序列的读数的数量来计算基因表达水平。所有的基因表达谱的热爱Lulea.使用MEV 4.0软件构建基因[48] Pearson的纠正和完整的联系聚类。使用GEO编号GSE130378提交到NCBI数据库的原始数据。

转基因植物的载体构建、基因转化及表型筛选

为了测试如何Lulea.基因可能影响植物开发,我们选择了一个Lulea.晚期种子成熟期间具有高表达的基因,用于遗传转化答:芥.所选基因,Lulea1.的表达水平,根据RNA-Seq数据,在DAP 30时的表达水平是在DAP 5时的10000倍。RNA-Seq原始数据在NCBI数据库中,GEO号为GSE130378 (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=gse130378.).全长CDLulea1.被克隆到CaMV 35S-Red载体中。质粒用限制性内切酶双酶切xma.我和埃森然后用特定的基因转录片段连接,使得靶基因的基因表达在CAMV 35s启动子的控制下。构建体被转化为根癌土壤杆菌菌株EHA105使用冻融法。拟南芥然后使用花卉DIP方法改变COL-0植物[49].Untransformed拟南芥植物作为WT对照。所有植物在标准条件下(24°Cday/18°C night和16 h light/8 h dark)保存在温室中。

筛选转基因植株,培养到T3代。然后收获种子,种子的大小和重量由作物扫描测试系统(万神SC-G,中国)确定[27.[种子数图像分析系统[50].采用气相色谱-质谱(GC-MS)对种子样品中的脂肪酸组成进行定量分析[50].

可用性数据和材料

小麦品种Macbeth和黑牙14号的RNA-seq原始数据亚麻属植物usitatissimumL.在GEO编号GSE130378下的NCBI数据库中以不同发育阶段获得的L.获得(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=gse130378.).本研究期间生成或分析的所有数据都包含在本发布的文章及其补充信息文件中。对当前研究使用和分析的数据集可在合理的请求时从相应的作者获得。

缩写

lea:

晚期胚胎发生丰富的蛋白质

SMP:

种子成熟蛋白

阿拉巴马州:

α-亚麻酸

IDPS:

内在无序蛋白质

朋友:

棕榈酸

STE:

硬脂酸

OLE:

油酸

LIO:

亚油酸

林:

亚麻酸

DAP:

授粉后一天

GC-MS:

气相色谱-分光计

参考

  1. 1。

    Hand SC, Menze MA, Toner M, Boswell LC, Moore DS。水分胁迫下的LEA蛋白:不再只是植物。2011;73(1): 115-34。https://doi.org/10.1146/annurev-physiol-012110-142203.

    CAS文章PubMed谷歌学术搜索

  2. 2。

    LEAPdb:胚胎发生晚期丰富蛋白数据库。BMC基因组学。2010;11(1):221。https://doi.org/10.1186/1471-2164-11-221

    CAS文章PubMedpmed中央谷歌学术搜索

  3. 3.

    TunnaCliffe A,Wise MJ。Lea蛋白的继续难题。NaturWissenschaften。2007; 94(10):791-812。https://doi.org/10.1007/S00114-007-0254-Y.

    CAS文章PubMed谷歌学术搜索

  4. 4.

    杜尔L,格林威S, Galau GA。棉籽胚胎发生与萌发的发育生化:从体内外蛋白质合成看信使核糖核酸群体的变化。生物化学,1981;20(14):4162 - 8。https://doi.org/10.1021/bi00517a033

    CAS文章PubMed谷歌学术搜索

  5. 5.

    百马克M, Hincha DK。拟南芥胚胎发生晚期丰富蛋白及其编码基因。BMC基因组学。2008;9(1):118。https://doi.org/10.1186/1471-2164-9-118

    CAS文章PubMedpmed中央谷歌学术搜索

  6. 6.

    王X,朱H,金G,刘H,吴W,朱J.稻米Lea基因的基因组鉴定与分析(Oryza Sativa L.)。植物SCI。2007; 172(2):414-20。https://doi.org/10.1016/j.plantsci.2006.10.004

    CAS文章谷歌学术搜索

  7. 7.

    关键词:LEA基因,西瓜,甜瓜,全基因组,表达分析植物生理学杂志。2017;23(1):5-21。https://doi.org/10.1007/S12298-016-0405-8

    CAS文章谷歌学术搜索

  8. 8.

    İbrahime M, Kibar U,喀山K, Yüksel Özmen C, Mutaf F, Demirel Aşçı S,等。葡萄LEA蛋白基因家族的全基因组鉴定(葡萄l .)。树遗传学基因组。2019; 15:55。

    文章谷歌学术搜索

  9. 9。

    关键词:茶树,胚胎发育晚期,基因家族,低温,脱水胁迫,表达分析植物生理学与生物化学。2019;135:277-86。https://doi.org/10.1016/j.plaphy.2018.12.009

    CAS文章PubMed谷歌学术搜索

  10. 10.

    李建平,李宗锁,李明安。高等植物LEA蛋白的结构、功能、基因表达及调控。生物界面学报。2005;45(3-4):131 - 139。https://doi.org/10.1016/j.colsurfb.2005.07.017

    CAS文章谷歌学术搜索

  11. 11.

    王米,李p,李c,潘y,姜x,zhu d等。Silea14是一种新型非典型lea蛋白,赋予Foxtail Mill的非生物胁迫阻力。BMC植物BIOL。2014; 14(1):290。https://doi.org/10.1186/s12870-014-0290-7.

    CAS文章PubMedpmed中央谷歌学术搜索

  12. 12.

    Battaglia M,Olvera-Carrillo Y,Garciarrubio A,Campos F,Covarrubias AA。神秘的Lea蛋白和其他疏水素。植物理性。2008; 148(1):6-24。https://doi.org/10.1104/pp.108.120725

    CAS文章PubMedpmed中央谷歌学术搜索

  13. 13。

    关键词:低温胁迫,脱氢蛋白,Lti30,可调膜结合植物细胞。2011;23(6):2391 - 404。https://doi.org/10.1105/tpc.111.085183

    CAS文章PubMedpmed中央谷歌学术搜索

  14. 14。

    Wise MJ,Tunnacliffe A. Popp这个问题:Lea Proteins做了什么?趋势植物SCI。2004; 9(1):13-7。https://doi.org/10.1016/j.tplants.2003.10.012

    CAS文章PubMed谷歌学术搜索

  15. 15.

    太阳x,rikkerink eha,琼斯wt,uversky vn。内在病症在蛋白质中的多种作用说明了对植物生物学的广泛影响。植物细胞。2013; 25(1):38-55。https://doi.org/10.1105/TPC.112.106062

    CAS文章PubMedpmed中央谷歌学术搜索

  16. 16.

    Savadi S.作物植物中种子发展的分子调节和工程种子大小的策略。植物生长调节。2018; 84(3):401-22。https://doi.org/10.1007/s10725-017-0355-3

    CAS文章谷歌学术搜索

  17. 17.

    Locascio A,Roig-Villanova I,Bernardi J,Varotto S.目前关于拟南芥种子发育的激素控制的目录:玉米种子发育的激素控制:对养羊酸的关注。前植物SCI。2014; 5:412。

    文章谷歌学术搜索

  18. 18.

    晚熟种子:干燥而不死亡。J Exp Bot. 2017:827-41。

  19. 19.

    Jin X,Cao D,Wang Z,MA L,Li Y.茶叶植物Lea蛋白基因家族的基因组鉴定及表达分析揭示了它们参与种子发育和非生物应激反应。SCI批准。2019; 9(1):14123。https://doi.org/10.1038/s41598-019-50645-8

    CAS文章PubMedpmed中央谷歌学术搜索

  20. 20.

    吴X,刘H,王W,陈S,Hu X,Li C.玉米种子活力蛋白质组学分析。Acta physiol植物。2011; 33(1):181-91。https://doi.org/10.1007/s11738-010-0536-4

    CAS文章谷歌学术搜索

  21. 21.

    等。关键词:生物化学,细胞生物学,细胞生物学,细胞生物学苜蓿种子后期成熟过程中热稳定蛋白质组的时间谱确定了一个与长寿相关的胚胎发生后期丰富蛋白质的有限子集。植物细胞学报。2012;35(8):1440-55。https://doi.org/10.1111/j.1365-3040.2012.02501.x.

    CAS文章PubMed谷歌学术搜索

  22. 22.

    Artur Mas,Zhao T,Ligterink W,Schranz E,Hilhorst HWM。将晚期胚胎发生的基因组多样化疏松植物中晚期(LEA)蛋白基因家族。基因组Biol Evol。2019; 11(2):459-71。https://doi.org/10.1093/gbe/evy248

    CAS文章PubMed谷歌学术搜索

  23. 23。

    Sano N, Rajjou L, North HM, Debeaujon I, Marion-Poll A, Seo M. alive: molecular aspects of seed longevity。植物生理学杂志。2016;57(4):670 - 74。https://doi.org/10.1093/pcp/pcv186.

    CAS文章PubMed谷歌学术搜索

  24. 24。

    Bies-ethèven,gaubier-comella p,追求一个,lasserre e,jobet E,Raynal M等人。拟南芥lea(晚期胚胎发生浓度)蛋白基因家族的库存,演化和表达分析多样性。植物mol biol。2008; 67(1-2):107-24。https://doi.org/10.1007/S11103-008-9304-X.

    CAS文章PubMed谷歌学术搜索

  25. 25。

    罗斯科·t·迪维克,我是马丁。种子成熟:植物控制网络的简化。植物科学。2016;252:335-46。

    文章谷歌学术搜索

  26. 26。

    关键词:晚期胚胎发生丰富(late embrgenesis abundant, LEA)蛋白,植物,非生物胁迫植物生长规律。2016;79(1):1 - 17。https://doi.org/10.1007/S10725-015-0113-3.

    CAS文章谷歌学术搜索

  27. 27.

    梁y,kang k,gan l,ning s,xiong j,song s等。干旱响应基因,晚期胚胎大量组3(lea3)和邻近氧螯合物,甘草内部植物中的脂质积累的功能主要通过提高光合效率和减少ROS。植物Biotechnol J. 2019; 17(11):2123-42。https://doi.org/10.1111/pbi.13127

    CAS文章PubMedpmed中央谷歌学术搜索

  28. 28.

    Li X,Cao J.晚期胚胎发生丰富(LEA)基因家族在玉米:识别,进化和表达概况。植物mol Biol rep. 2016; 34(1):15-28。https://doi.org/10.1007/s11105-015-0901-y

    CAS文章谷歌学术搜索

  29. 29.

    梁y,xiong z,郑俊,徐d,zhu z,xiang j等。基因组鉴定,结构分析和新胚胎发生的新见解丰富(LEA)基因家族形成图案在芸苔植物中。SCI REP。2016; 6(1):24265。https://doi.org/10.1038/srep24265

    CAS文章PubMedpmed中央谷歌学术搜索

  30. 30.

    Nagaraju MSS,Kumar SA,Reddy PS,Kumar A,Rao DM,Kishor PBK。高粱双子石L.普罗斯氏菌属中非胚胎胁迫条件下晚期胚胎发生(LEA)基因的基因组鉴定,分类和组织特异性表达分析。2019; 14(1):E0209980。https://doi.org/10.1371/journal.pone.0209980

    CAS文章PubMedpmed中央谷歌学术搜索

  31. 31.

    小麦后期胚胎发生丰富蛋白(LEA)的结构、功能和进化分析:一种详细的分子水平生物化学使用的方法。Comput Biol Chem. 2019; 82:9-24。https://doi.org/10.1016/j.compbiolchem.2019.06.005

    CAS文章PubMed谷歌学术搜索

  32. 32.

    Zan T,Li L,Li J,Zhang L,Li X.基因组 - 覆盖晚胚胎发生丰富蛋白质编码基因家族的基因组鉴定与表征在开发和应力过程中的进化和表达谱。基因。2020; 736:144422。https://doi.org/10.1016/j.gene.202010144422

    CAS文章PubMed谷歌学术搜索

  33. 33.

    康Qh,江WD,歌曲XX,Sun Zy,元HM,Yao Yb等。在亚麻悬浮赛的研究进展(亚麻属植物usitatissimuml .)。J Nat Fibers. 2019; 18:1-11。

    文章谷歌学术搜索

  34. 34.

    加拿大亚麻种子品质性状关联图谱的建立亚麻属植物usitatissimumL.)核心系列。Al Appl Genet。2014; 127:881-96。

    文章谷歌学术搜索

  35. 35。

    LM,Booker H,Siloto RMP,Jhala Aj,Weselake RJ。第6章 - 亚麻(亚麻属植物usitatissimuml .)。入选:TA MK, Hayes DG, Hildebrand DF, Weselake RJ, editors。工业油料作物。美国:家出版社;2016.p . 157 - 94。

    章节谷歌学术搜索

  36. 36。

    王Z,霍布森N,Galindo L,朱S,Shi D,McDill J等。从短霰弹枪序列读取的亚麻(Linum Usitatisimumumum)的基因组组装De Novo。工厂J. 2012; 72(3):461-73。https://doi.org/10.1111/j.1365-313x.2012.05093.x

    CAS文章PubMed谷歌学术搜索

  37. 37。

    蓝涛,高洁,曾庆燕。毛叶杨胚胎发育晚期丰富蛋白基因家族的全基因组分析。中国生物医学工程学报,2013;https://doi.org/10.1007/s11295-012-0551-2

    文章谷歌学术搜索

  38. 38。

    赵鹏,王丹,王锐,孔宁,张超,杨超,等。马铃薯Hsp20基因家族的全基因组分析:鉴定,基因组组织和表达谱对热应激的响应。BMC基因组学。2018;19(1):61。https://doi.org/10.1186/s12864-018-4443-1

    CAS文章PubMedpmed中央谷歌学术搜索

  39. 39.

    宋米,张Y,王L,Peng X. Zinc手指Homeodomain家族基因组的基因组鉴定与系统发育分析。Chin Bull Botan。2019; 54:699-710。

    谷歌学术搜索

  40. 40.

    Jeffares DC,Penkett CJ,巴勒J.快速调节基因是内含子贫困。趋势类型。2008; 24(8):375-8。https://doi.org/10.1016/j.tig.2008.05.006

    CAS文章PubMed谷歌学术搜索

  41. 41.

    Zafar S,Li Yl,Li Nn,Zhu Km,Tan XL。油籽作物中油含量的最新进展。j biotechnol。2019; 301:35-44。https://doi.org/10.1016/j.jbiotec.2019.05.307

    CAS文章PubMed谷歌学术搜索

  42. 42.

    Li N,Li Y.种子大小控制中的信号传导途径。CurrOp植物BIOL。2016; 33:23-32。https://doi.org/10.1016/j.pbi.2016.05.008

    CAS文章PubMed谷歌学术搜索

  43. 43.

    Potter Sc,Aurélienl,eddy sr,youngmi p,rodrigo l,芬恩rd。HMMER Web服务器:2018更新。核酸RES。2018; 46(W1):W200-4。https://doi.org/10.1093/nar/gky448

    CAS文章PubMedpmed中央谷歌学术搜索

  44. 44.

    Larkin Ma,Blackshields G,Brown NP,Chenna RM,McGettigan Pa,McWilliam H,等。Clustal W. Clustal X 2.0版。生物信息学。2007; 23(21):2947-8。https://doi.org/10.1093/bioinformatics/btm404

    CAS文章PubMed谷歌学术搜索

  45. 45.

    Kumar S,SteCher G,Tamura K. Mega7:用于更大数据集的分子进化遗传学分析版本7.0。mol Biol Evol。2016; 33(7):1870-4。https://doi.org/10.1093/molbev/msw054

    CAS文章PubMedpmed中央谷歌学术搜索

  46. 46.

    Yu-u,yan l,qing-hua k,ying lu,xue y,feng-zhi g等。新纤维亚麻繁殖14号Heiya No.14的繁殖报告。中国的纤维作物。2003; 3(8-9):38。

    谷歌学术搜索

  47. 47。

    Anders S,Huber W.序列计数数据的差异表达分析。基因组Biol。2010; 11(10):R106。https://doi.org/10.1186/gb-2010-11-10-R106

    CAS文章PubMedpmed中央谷歌学术搜索

  48. 48。

    Saeed Ai,Sharov V,White J,Li J,Liang W,Bhagabati N等人。TM4:用于微阵列数据管理和分析的免费开源系统。生物技术。2003; 34(2):374-8。https://doi.org/10.2144/03342mt01

    CAS文章PubMed谷歌学术搜索

  49. 49。

    阵伤SJ,弯曲AF。花卉浸:农杆菌介导的拟南芥转化的简化方法。工厂J. 1998; 16(6):735-43。https://doi.org/10.1046/j.1365-313x.1998.00343.x

    CAS文章谷歌学术搜索

  50. 50。

    陈克,尹y,刘某,郭z,张k,梁y等。BMC植物BIOL中油脂基因的基因组型鉴定与功能分析。2019; 19(1):294。https://doi.org/10.1186/s12870-019-1891-y

    CAS文章PubMedpmed中央谷歌学术搜索

下载参考

致谢

这项工作是在中国农业科学院生物技术研究所中央实验室进行。

陈述

上述所有方法都是按照相关的准则和规定进行的。亚麻品种黑亚14号和麦克白的种子保存在生物技术研究所,获准用于本研究。

资金

该研究是由国家转基因研究(2016年ZX08011-001号)和宁夏中国科技部门(2021BBF02022)的国家特别方案的资金经济支持。

作者信息

从属关系

作者

贡献

概念化,Y.L.和X.W.P.;方法,Z.L.;软件,zl和C.Y.L.;验证、zl、h.c.、t.b.z、c.y.l;数据管理,l.d.h., h.c., c.y.l., T.B.Z.;书面-原稿准备,z . l;L.L.和Y.L.;融资收购,X.W.P . .所有作者都已阅读并同意该手稿的出版版本。

相应的作者

对应于Xinwu裴燕龙

伦理宣言

伦理批准和同意参与

我们的研究没有涉及任何人类或动物的对象、材料或数据。本研究中使用的植物材料由生物技术研究所保存。

同意出版物

不适用。

利益争夺

所有作者宣布他们没有竞争利益。

额外的信息

出版商的注意

Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。

补充信息

附加文件1:补充图1的位置

Lulea.染色体上的基因。每个方框代表一条染色体,其中Lulea.基因被定位在苗条的条形图上。同一亚家族的基因具有相同的颜色。染色体左侧的规模以数百万个碱基(Mb)为单位。

附加文件2:补充表1

所有50的亚细胞定位预测Lulea.基因。

权利和权限

开放访问本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/.Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非另有用入数据的信用额度。

重印和权限

关于这篇文章

通过Crossmark验证货币和真实性

引用这篇文章

李,Z.,Chi,H.,Liu,C。等等。基因组 - 范围识别和功能表征LEA亚麻种子发育过程中的基因(亚麻属植物usitatissimuml .)。BMC植物杂志21日,193(2021)。https://doi.org/10.1186/s12870-021-02972-0.

下载引用

关键词

  • LEA基因鉴定
  • 功能分析
  • 种子发展
  • 脂肪酸
  • 亚麻籽亚麻