跳到主要内容

组织特异性转录组分析揭示象草中木质纤维素合成的调控机制(狼尾草purpureumSchum)

摘要

背景

象草的特性,特别是其茎部木质纤维素的特性,对其作为饲料或其他工业原料的品质具有重要意义。然而,由于象草的基因组尚未破译,对其木质纤维素生物合成途径及关键基因的研究受到了限制。

结果

本研究以不同发育阶段的象草茎为材料,采用RNA测序(RNA-seq)结合木质纤维素含量分析和细胞壁形态观察,揭示了调控纤维素和木质素合成的基因。通过RNA-seq分析,在T1、T2、T3三个时间段共鉴定出3852个差异表达基因(deg)。京都基因与基因组百科(KEGG)对所有DEGs的分析表明,最丰富的两条代谢途径是苯丙烷代谢、淀粉代谢和蔗糖代谢,它们与细胞壁发育、半纤维素、木质素和纤维素合成密切相关。通过对DEGs的加权基因共表达网络分析(WGCNA),发现了一个与纤维素合成高度相关的“蓝色”模块和一个与木质素合成高度相关的“绿松石”模块。共筛选到43个候选基因,其中17个在其他物种中具有功能注释。此外,通过分析不同发育阶段象草茎组织中木质纤维素的含量及基因的表达水平中国极限运动协会朋友计算机辅助设计C4HCOMT的CCoAMTF5H而且CCR,发现木质纤维素的含量与这些结构基因的表达水平有关。

结论

本研究为进一步了解象草纤维素和木质素合成途径的分子机制提供了基础,为今后的专门功能研究提供了独特而广泛的候选基因列表,有望促进高纤维素低木质素的优质象草品种的开发。

背景

纤维主要由纤维素、木质素和半纤维素三种生物大分子组成,在植物的生长和胁迫响应中起着至关重要的作用。纤维的形成和组分的沉积加强了特殊类型的细胞,如纤维细胞和导管细胞,形成机械组织,为植物细胞提供结构支撑和保护,并在蒸腾过程中产生负压梯度,保护植物细胞。纤维的形成是一个复杂的过程,需要多种代谢途径的协调和平衡[12].

纤维素是纤维中最重要的成分。在纤维素合成过程中,纤维素合成酶(CesA)单体形成纤维素合成酶络合物(CSC),通过相关底物催化纤维素的右旋糖酐链的合成。一般来说,有两个或两个以上的CesA蛋白参与纤维素的合成。到目前为止,中国极限运动协会已在面包小麦中克隆(小麦l .)拟南芥,玉米(玉米L.)、杨树(Populust remuloides)和其他一些植物,它们的功能已被阐明[3.45].在杨树,PtrcesA2而且PtrcesA1同源于拟南芥突变体IRX1而且IRX3,分别。它们均在杨树木质部次生壁形成过程中表达。据推测,这两个基因可能与细胞壁的形成有关[6].

除了纤维素合成酶基因外,其他基因在纤维素生物合成中也起着重要作用,如KORRIGAN、蔗糖磷酸合酶、细胞骨架蛋白、脂质转移蛋白、氧化蛋白[78].KORRIGAN编码1,4-β- d -葡萄糖苷酶,其突变体显示纤维素含量减少,果胶合成增加,导致过度愈伤组织形成。此外,也有研究发现MYB转录因子可以调控纤维素合成酶基因的表达水平,从而改变植物的纤维素含量和茎秆强度。研究人员利用候选基因遗传转化和基于图谱的克隆技术,研究了转录因子OsMYB103L对水稻细胞壁合成的调控机制栽培稻l) (9].

半纤维素是次生壁的另一个主要成分。它能与纤维素形成网状结构,使细胞壁更加紧密。已知的半纤维素包括木葡聚糖、木聚糖、β-1,3 (1,4) -d-葡聚糖和甘露聚糖。虽然半纤维素是一种杂多糖,但大多数半纤维素具有单一的骨架。除木聚糖外,半纤维素的所有主链均由类纤维素合成酶(CSL)合成[10].木聚糖也以β- 1,4-糖苷键为主链,但由糖基转移酶(GT)家族相关家族成员合成[11].

木质素是植物细胞壁中含量第二丰富的成分,主要作用是提高植物细胞壁强度和茎的抗弯性[1].木质素是一种复杂的酚醛聚合物,其单体合成来源于苯丙烷途径和木质素特异性途径[12].木质素单体合成酶基因主要包括朋友C4H摘要:4 clCOMT的CCoAMTF5H计算机辅助设计而且CCR等,已在玉米中研究过[13],拟南芥14],杨树(Populust remuloides) [15]、黑麦草(多年生黑麦草l .) [16]、柳枝稷(黍virgatumL.)及其他植物[17].上调或下调这些基因的表达量可改变木质素的含量和组成。通过下调木质素生物合成途径基因的表达Pt4CL1在杨树中,木质素和纤维素的沉积可以以代偿方式调节,这可能有助于代谢灵活性和生长优势,以维持木本多年生植物的长期结构完整性[12].在拟南芥NAC、MYB、WRKY等转录因子也参与木质素生物合成的调控。

象草(狼尾草purpureumSchum.)是一种多年生禾本科C4植物,原产于热带非洲,后来广泛分布于亚洲、非洲和美洲的热带和亚热带气候区。它是世界上生物量最高的植物之一,株高可达3 ~ 5米,年生物量可达4500kg /hm−218].象草的主要生物学特性是光合作用高、产量高、抗生物和非生物胁迫。象草不仅是一种优质的畜禽饲料[19],是理想的水土保持植物,优质纸浆原料,生物燃料制备原料,也是理想的木质纤维素能源植物[20.2122].象草的特性,特别是其茎部木质纤维素的特性,对其作为饲料或其他工业原料的品质具有重要意义。提高纤维素含量,降低木质素含量,可以提高饲料质量,提高木质纤维素的转化利用效率。

象草是同种异体四倍体作物(A 'A 'BB, 2n = 4x = 28),具有复杂的基因组。由于其雌雄同体开花行为,该物种主要是异花授粉,导致高杂合度和广泛的遗传多样性,可用于育种方案。尽管象草基因组尚未被破译,但其遗传研究主要集中在通过构建分子标记和指纹图谱以及确定遗传关系来评价遗传多样性[232425].同时,研究人员通过RNA-seq分析揭示了象草根和叶中花青素的生物合成途径,以及对镉早期反应的分子机制[2627].基于表型选择的传统育种方法在改善象草农艺性状方面也取得了一些进展[2428].虽然木质纤维素合成的调控网络已在其他物种如拟南芥如玉米、杨树、柳枝稷等,对象草的研究仍然匮乏。

目前,RNA-seq分析已广泛应用于各种植物研究,如利用RNA-seq分析转基因烟草中苯丙烷途径的遗传操纵,为作物改良提供了新的基础见解和前景[29].比较转录组分析揭示了桑黑花青素生物合成的机制。桑属个Roxb.)和white (桑属阿尔巴L.)果实基因型[30.].RNA-seq分析也逐渐应用于象草的研究[2627].因此,本研究采用同样的方法对象草中木质纤维素合成的重要基因进行了探索。

本研究以12个不同茎发育阶段的象草样品为材料,进行RNA-seq分析、木质纤维素成分分析和细胞壁形态观察。结合GO、KEGG、WGCNA和Q-PCR相关分析,筛选出了一些候选基因,为研究象草纤维形成的分子机制提供了有价值的基因组数据。这些结果为其他纤维植物的木质纤维素合成调控提供了理论指导,也为其遗传改良提供了重要的遗传资源。

结果

不同发育阶段象草茎中纤维素、半纤维素和木质素含量的变化

测定了T1、T2、T3期不同茎段的纤维素、半纤维素和木质素含量。结果表明,纤维素和半纤维素含量先升高后降低。例如,T1-S2中纤维素和半纤维素含量高于T1-S1,而T1-S3含量低于T1-S2,而木质素含量则逐渐下降。不同茎节在T2和T3期也有相似的变化。同时,通过分析同一茎节在不同发育时期的含量变化,还发现随着象草生长时间的增加,纤维素和半纤维素含量减少,而木质素含量增加(图2)。1b)。

图1
图1

象茎不同发育阶段的纤维素、半纤维素和木质素含量。不同字母表示差异有统计学意义(ANOVA, Duncan < 0.05)。一个采样周期和位置。b纤维素、半纤维素和木质素

内容

通过分析初生细胞壁与次生细胞壁的比值,发现随着细胞发育时间的增加,次生细胞壁增加,而细胞壁与初生细胞壁的比值不断上升,这可能是木质素含量逐渐增加的原因,以维持和支撑象草茎的强度(图。S1).

象草茎不同发育阶段细胞壁的特征

观察了象草不同发育阶段细胞壁形态的变化,尤其是初生和次生细胞壁的变化(图2)。2a). T1-S1和T1-S2的次生细胞壁厚度与初生细胞壁厚度之比分别为1.18和0.85,T2-S1和T2-S2的sw/pw厚度之比分别为1.67和0.92,T3-S1和T3-S3的sw/pw厚度之比分别为2.15和1.25(图1)。2b).以上数据表明,T1、T2、T3的sw/pw厚度变化趋势是一致的,即随着发育时间的增加,次生细胞壁(sw)的发育速度要快于初级细胞壁(pw)。并分析了S1节3个不同发育阶段的sw/pw比值。结果表明,随着发育时间的增加,T1-S1、T2-S1、T3-S1的sw/pw厚度比逐渐增大。3个不同发育阶段S2和S3阶段sw/pw厚度比的变化趋势相同。

图2
figure2

象草茎部不同发育阶段细胞壁形态和厚度的变化。不同字母表示差异有统计学意义(ANOVA, Duncan < 0.05)。一个a.T1-S1, b, T1-S2 c。T2-S1, d。T2-S2, e。T3-S1, f。T3-S3。SW:次生细胞壁,PW:初生细胞壁。b次生细胞壁与初级细胞壁的厚度比

为了进一步了解象草发育过程中细胞壁的形态变化,我们选取T3期发育时间跨度较长的S1和S5茎段作为样本进行显微ct观察。象草茎由表皮、薄壁细胞和维管束组成。维管束由韧皮部和木质部组成,无形成层,分散在薄壁细胞内,不能增厚。随着茎组织的发育,S1维管束排列整齐紧凑(图2)。S1).维管束中纤维素和半纤维素含量逐渐降低,木质素含量逐渐增加(图2)。1B)满足象草茎秆成熟过程中所需的机械支撑。

象草茎秆发育过程中的差异基因表达

从不同时期的象草茎中构建了36个cDNA文库(每个组织3个生物重复)。每个样本过滤6.56-21.07 Gb后,共获得13.2亿个原始reads (396.96 Gb), 12.9亿个清洗reads (388.57Gb)。错误率为0.03% (Q20和Q30值分别大于93和90%),满足基因发现要求(表1)S1).De novo assembly从12个具有代表性的测序深度最大的样本中生成了77435个簇序列。最终,我们得到了一个包含230,572个独特基因的非冗余转录簇,平均长度为961.35 bp, N50为1435 bp, N90为423 bp(图2)。S2).转录组从头组装采用short reads组装程序- trinity [31].基于各文库表达值的Pearson相关系数表明,样本重复之间具有较高的相关性(图2)。S3).样品间聚类分析表明,象草发育时间是影响聚类的主要因素。对象草茎三个发育阶段的DEGs进行分析,分别在T1、T2和T3三个发育阶段鉴定出15611个、10235个和27389个DEGs(图;3.).对不同茎段在3个发育阶段的DEGs进行分析,发现T1的3个片段中有147个基因表达,T2的4个片段中有54个基因表达,T3的5个片段中有91个基因表达(图2)。3.).比较三个不同发育阶段的所有deg的交集,以确定共享核心集。研究发现3852个基因在三个发育阶段有差异表达(图2)。3.d)。

图3
图3

通过RNA序列分析发现了象草发育阶段茎组织中的差异表达基因(DEGs)。一个相邻三个阶段(T1-S1, T1-S2, T1-S3)之间的DEG数。绿色:T1-S1 Vs T1-S2,蓝色:T1-S1 Vs T1-S3。b相邻四个阶段(T2-S1, T2-S2, T2-S3, T2-S4)之间的DEG数。绿色:T2-S1 Vs T2-S2,蓝色:T2-S1 Vs T2-S3,黄色:T2-S1 Vs T2-S4。c相邻五个阶段(T3-S1, T3-S2, T3-S3, T3-S4)之间的DEG数。紫色:T3-S1 Vs T3-S5,绿色:T3-S1 Vs T3-S2,蓝色:T3-S1 Vs T3-S3,黄色:T3-S1 Vs T3-S4。dT1, T2和T3期的差异。蓝色:T1 (DEGs),绿色:T2 (DEGs),黄色:T3 (DEGs)

然后对3,852个deg进行GO功能和KEGG通路的富集分析。前10个富集的GO注释功能中,有4个与外质体、细胞壁、细胞外区、植物型细胞壁等细胞组成有关,4个与过氧化物酶活性、木葡聚糖、木葡聚糖转移酶活性、血红素结合、木葡聚糖特异性内do - β - 1,4−葡聚糖酶活性等分子功能有关,2个与细胞壁大分子分解代谢过程、过氧化氢分解代谢过程等生物过程有关(图)。4一)(表S2).根据KEGG通路分析,所有的DEGs都被富集到9个通路(表7)S3),其中最显著的两个途径是苯丙烷代谢(23 DEGs)和淀粉和蔗糖代谢(23 DEGs)(图。4b)。

图4
装具

在T1、T2和T3三个发育阶段共表达的3852个DEGs经GO和KEGG富集。一个氧化石墨烯富集分析。bKEGG富集分析

通过WGCNA分析发现与纤维素、半纤维素和木质素合成高度相关的基因

加权基因共表达网络分析(Weighted gene co-expression network analysis, WGCNA)分3个阶段对3852个基因共表达网络进行分析,并将网络分为3个模块。模块-性状关系分析表明,“蓝色”模块与纤维素的合成高度相关(r= 0.67,P= 6 × 10−6)和半纤维素(r= 0.51,P= 0.001),而“绿松石”模块与木质素合成有关(r= 0.68,P= 5.0 × 10−6)(图。S4).

根据模块隶属度> 0.9对' blue '模块进行筛选,' turquoise '模块与木质素的相关系数绝对值大于0.75,' blue '模块和' turquoise '模块中分别保留了20个和23个基因。WGCNA基因显著性(GS)(即与性状相关)表明,“蓝色”和“绿松石”模块中GS最高的基因分别为Cluster-55,067.0(0.659)和Cluster-17,353.3(0.798)。在“蓝色”模块的20个基因中,已知有6个是功能性的,例如GTL1转录因子o -甲基转移酶(OMT),扩张素样a2, α -葎草烯合成酶,可能是半乳糖醇蔗糖,GhGalT1.同时,“蓝色模块”还覆盖了14个功能未知的基因,有待进一步研究。“blue”模块中这20个基因的GO功能标注包括细胞外区、C-4甲基甾醇氧化酶活性、萜烯生物合成等相关基因。这些基因的表达水平如图所示。5

图5
figure5

象草茎部不同发育阶段43个基因WGCNA分析表达谱的热图

在“绿松石”模块的23个基因中,有8个编码基因,如GTL1MYB2转录因子,苏氨酸蛋白激酶ERECTA,可能的蛋氨酸- trna连接酶,含醇氢化酶样2,锌指蛋白GIS3,蛋白slr0074,富脯氨酸受体样蛋白激酶PERK8。“turquoise”模块中这23个基因的GO功能注释包括与细胞生长调控、次生细胞壁形成调控、细胞壁组成调控等相关的基因,还有15个基因功能未知(表S4).

象草茎发育过程中木质素和纤维素合成途径

纤维素合成酶(CesA)是纤维素合成途径中最重要的酶。它可以直接利用淀粉和蔗糖代谢产生的UDPG合成纤维素。在象草中,27中国极限运动协会基因被鉴定。在T1期,表达水平CesA1-CesA6全茎表达量较高,T2和T3期表达量下降,而CesA7-CesA27嫩茎在T1、T2和T3期均显著高于成熟茎。这表明中国极限运动协会Gene主要在嫩茎组织中合成纤维素。当纤维素积累到一定水平时,其表达量逐渐降低(图2)。6一个)。

图6
figure6

象茎不同发育阶段纤维素合成酶基因和木质素合成相关基因表达谱的热图。一个27个纤维素合成酶基因表达谱热图。bcdef木质素合成相关基因表达谱热图。四种不同颜色的网格表示基因的绝对表达,分别用2、1、0、−1和−2的不同尺度水平表示。PAL:苯丙氨酸解氨酶;C4H:肉桂酸羟基化酶;肉桂酰辅酶a还原酶;CAD:肉桂醇脱氢酶;F5H: FerulicAcid5-Hydroxylase;CoAOMT: Caffeoyl-CoAO-methytransferase;COMT: 5-羟阿魏酸o -甲基转移酶/双特异性咖啡酸

木质素合成是苯丙烷代谢的重要途径之一。在木质素代谢途径中,计算机辅助设计(21 unigenes)的时候,4 cl9(21 unigenes)的时候,C4H(8 unigenes),朋友(16 unigenes),CCR(25 unigenes),F5H(6 unigenes),CCoAOMT(4个unigenes)被鉴定为相关。表达分析发现,这些基因家族的大多数成员在成熟茎中表达量较高。相反,少数基因成员在整个组织中连续表达(图。6B, c, d, e, f)。

qRT-PCR结果显示,这些基因的表达趋势与RNA-seq数据一致(图。S5、表S6).总的来说,随着茎的发育,纤维素合成基因和木质素合成相关基因的表达量呈相反趋势。另一方面,茎纤维素、半纤维素和木质素含量的变化以及初生茎壁和次生细胞壁厚度的变化与这两类基因的表达呈正相关。

讨论

象草是地球上生物量最高的牧草之一,广泛应用于饲料和生物能源相关行业。进一步了解与木质纤维素合成相关的基因及重要代谢途径,对分子选育象草新品种,使其更适合工业化应用具有重要意义。

在我们的研究中,3852个差异表达基因(DEGs,调整p在12个不同发育阶段的象草茎样中均鉴定出< 0.05)。同样的方法也用于鉴别象草和桑树花青素合成途径中的deg [2630.].对DEGs的GO富集分析发现,富集前10位的GO注释功能包括细胞壁、植物型细胞壁、细胞壁大分子分解代谢过程等3个与细胞壁发育直接相关的功能。KEGG途径分析发现,蔗糖、淀粉代谢和苯丙烷代谢是差异基因富集最显著的代谢途径。木质素合成是苯丙烷代谢的重要分支之一[32],纤维素合成的底物可由淀粉和蔗糖代谢途径提供[3334],表明这些DEGs可能会影响纤维素和木质素的合成。

在纤维素合成过程中,蔗糖是起始底物,其分解产生的UDPG在的作用下可以直接合成葡聚糖链中国极限运动协会基因(35].27中国极限运动协会在象草中发现的基因比小麦(14种)等其他物种更丰富[4],拟南芥(10种)[3.]、玉米(10种)[5]、杨树(16种)[8].中国极限运动协会主要在嫩茎组织中表达(图;6a).随着茎的发育,纤维素含量逐渐积累(图。1).高拷贝中国极限运动协会在象草中使其具有很高的纤维素合成潜力。到目前为止,中国极限运动协会已证实其在面包中的作用(小麦l .)拟南芥,玉米(玉米L.)、杨树(Populust remuloidesL.)及其他植物[3.45].象草成熟茎中纤维素含量明显高于玉米、小麦、芦苇等植物[36].

共有101个木质素合成相关基因,如朋友C4H4 clCCoAMTF5H计算机辅助设计,CCR都是在象草中发现的PAL是苯丙烷代谢途径中的关键酶,其抑制作用会降低木质素含量,影响植物的生长发育。4CL是生产G或s木质素单体的关键限速酶。不同表达量的4CL可以调节三种木质素单体的含量,促进或抑制木质素单体的表达4 cl基因可显著调节木质素/纤维素的相对比例[37].在象草中,16朋友基因与214 cl基因主要在成熟茎组织中表达,导致成熟茎中木质素含量较高。这些基因在烟草中的抑制或过表达也会影响木质素含量[2938].

为了进一步了解这些DEGs与木质纤维素组分之间的关系,我们进行了WGCNA,发现有20个基因与纤维素和半纤维素的合成有关,23个基因与木质素的合成有关。在这43个基因中,有14个基因通过GO注释被鉴定出具有精确的功能,其中一些基因如OMT而且GalT1与木质纤维素的合成直接相关,其中一些在生长发育和细胞壁形成中起重要作用。有28个基因功能未知,有待进一步功能验证。在烟草,据报道,或反义表达序列编码O-methyltransferase (OMT)可调节木质素合成酶的活性[39].转基因棉花纤维长度过表达GhGalT1短于野生型,而在GhGalT1沉默品系的纤维长度较野生品系显著增加[40].

总的来说,我们的研究表明,象草茎秆发育过程中细胞壁组成和形态的动态变化与纤维素和木质素相关基因的变化和表达是一致的。这些数据为今后更专业的功能研究提供了新的、广泛的候选基因列表,也为象草木质纤维素合成的遗传改良提供了必要的理论基础。

结论

本研究对象草茎的RNA-seq、木质纤维素含量和细胞壁形态进行了分析,为进一步揭示象草木质纤维素的合成和积累机制提供了依据。共鉴定出3852个常见的deg。KEGG分析表明,两种最丰富的代谢途径分别是苯丙烷代谢(23 DEGs)、淀粉代谢和蔗糖代谢(23 DEGs),其中苯丙烷代谢是木质素合成的重要途径,而后者产生UDPG用于纤维素合成。27中国极限运动协会分别鉴定出纤维素合成相关基因和101个木质素合成相关基因。中国极限运动协会木质素相关基因在幼茎中表达量较高,而在成熟茎中表达量较高。此外,WGCNA共筛选出43个候选基因,其中17个在其他物种中具有功能注释。其中,GTL1转录因子和o -甲基转移酶(OMT)基因已被证实在其他植物中调控木质纤维素的合成。

方法

实验材料

在山东省济南市齐鲁工业大学温室内培养象草。分别取苗期40 d (T1期)、80 d (T2期)、120 d (T3期)的秸秆取样。取茎的最低节点标记为S1,其余各茎节点分别标记为S2、S3、S4和S5。T1期取3个样本(茎节)(T1- s1、T1- s2、T1- s3), T2期取4个样本(T2- s1、T2- s2、T2- s3、T2- s4), T3期取5个样本(T3- s1、T3- s2、T3- s3、T3- s4、T3- s5)(图。1)。共收集36个样本,每个样本包括3个生物重复。所有样品立即在液氮中冷冻,并保存在−80°C,然后提取总RNA。

纤维素、半纤维素和木质素含量的测定

待测样品自然风干或置于烘箱中烘干(温度不超过50℃)至水分低于10%,用研磨机粉碎筛分。取20 - 80目的部分,冷却,并储存在密封袋中进行进一步分析。采用高效液相色谱法根据NERL法进行含量分析[4142].还原糖采用高效液相色谱法(Shimadzu, Kyoto, Japan),采用Shimadzu LC-10 AD检测器进行分析。HPLC在Bio-Rad HPX-87H柱中进行,注入量为10 uL,温度为60°C,温度为5 mM H2所以4作为洗脱液,流速为0.4 mL/min [43].纤维素、半纤维素和木质素含量为样品干重的百分比。

细胞壁形态观察

选取象茎三个不同发育阶段纤维素含量最高和最低的时间段为样本,将新鲜茎切成1 cm × 1 cm的小段,置于2.5%戊二醛磷酸盐缓冲液(0.1 mol/L, pH = 7.0)中。样本按报告处理[44]并在EM-420透射电子显微镜下观察(飞利浦电子,荷兰)。

象草茎的显微CT观察

将象草茎切成1 cm × 1 cm的小块,放入2.5%戊二醛磷酸盐缓冲液(0.1 mol/L, pH = 7.0)中,4℃储物柜中固定3 h,用1 mol/L磷酸盐缓冲液清洗固定组织2次,置于40℃烤箱中24 h。在skscan 2211 micro-CT (Bruker, Belgium)下观察处理后样品的截面。

RNA提取和转录组测序

根据制造商的说明,使用HiPure Plant RNA Kit (Magen, Guangzhou, China)从茎中提取总RNA。每个样品共3 μg RNA用于文库制备,插入物大小为350 bp,在Novaseq 6000 (Illumina, USA)上测序。RNA-seq分析使用Illumina平台,按照标准协议进行[45].

RNA-seq和转录组组装的质量控制

fastq格式的原始数据(Raw reads)首先通过Trim Galore (http://www.bioinformatics.babraham.ac.uk/projects/trim_galore/) [31].在这一步中,通过从原始数据中删除包含适配器、ploy-N和低质量读取的读取来获得干净数据(干净读取)。同时计算洁净数据的Q20、Q30、gc含量和序列重复水平。所有下游分析均基于干净的高质量数据。选取测序量最大的12个样本,用Trinity-v2.9.1软件进行组装[46],共组装627786条序列,然后利用cd-hit-estv4.8.1软件对627786条序列按序列相似度为0.97进行聚类,筛选出477435条具有代表性的序列[47].利用salmonv1.1.0软件将每个样本的测序数据映射回477,435个有代表性的序列,得到每个样本的bam文件[48].根据bam文件,利用corset软件根据reads的比较结果对477,435个代表性序列进行聚类,最终获得230,572个代表性序列及相关丰度文件[49].

基因功能注释

基因功能基于以下数据库进行标注:Nr (NCBI非冗余蛋白序列)(https://www.ncbi.nlm.nih.gov/);Swiss-Prot(一个手动注释和审阅的蛋白质序列数据库)(http://www.gpmaw.com/html/swiss-prot.html);高级文书主任(KEGG Ortholog数据库)(https://www.kegg.jp/);高级行政主任(基因本体)(http://geneontology.org/).

差异表达与富集分析

差异表达分析采用R包DESeq [24].的p-值采用Benjamini-Hochberg (BH)方法进行调整。具有调节的基因p-value < 0.05为deg。R Package Goseq对T1、T2、T3三个阶段鉴定的3852个差异deg进行GO富集和KEGG通路富集分析[50].群体集是一个包含所有注释基因的集合,研究集由群体集中的deg组成。的p-值按照差分表达式分析进行调整。调整p-value < 0.05为GO富集分析和调整pKEGG通路富集分析的-value < 0.1被认为是显著的。

加权基因共表达网络分析

利用WGCNA对T1、T2、T3时段常见差异表达基因的基因表达谱构建共表达网络。在所有组织中未检测到表达的基因在分析前被去除。软阈值基于无标度拓扑准则[5152].

存在分析

dna处理的RNA (2 μg)使用高容量cDNA逆转录试剂盒(Applied Biosystems, Foster City, USA)进行逆转录。基因特异性引物使用Primer Express (v3.0, Applied Biosystems)设计。使用SYBR Green I Master Mix (Roche, Indianapolis, USA)进行定量反转录PCR (qRT-PCR)分析。在LightCycler 480仪器(Roche, USA)上对每个反应进行3次生物重复和3次技术重复分析,第一步为95°C持续5分钟,随后为95°C持续10秒,60°C持续10秒,72°C持续20秒,进行40次循环。熔化曲线是用以下程序生成的:95°C 15 s, 60°C 15 s, 95°C 15 s。18S rRNA作为内部对照。数据分析计算采用2——ΔΔCT方法。采用IBM SPSS Statistics 19.0软件对不同样本进行显著性差异检验。

数据和材料的可用性

在当前研究中生成和/或分析的数据集可在EBI (EMBL)项目PRJEB40973 (https://www.ebi.ac.uk/ena/browser/view/PRJEB40973),注册编号ERP124692。任何合理的要求都可以从通讯作者那里得到。

缩写

RNA-seq:

RNA序列

度:

差异表达基因

KEGG:

京都基因和基因组百科全书

WGCNA:

加权基因共表达网络分析

中国极限运动协会:

纤维素合酶

CSL:

纤维素synthase-like

GT:

糖基转移酶

西南:

次级细胞壁

pw:

原代细胞壁

g:

基因的意义

OMT:

O-methyl转移酶

走:

基因本体论

柯:

KEGG正交数据库

BH:

Benjamini-Hochberg

UDPG:

尿苷diphosphoglucose

朋友:

苯丙氨酸ammonia-lyase

C4H:

肉桂acid4-hydroxylase

CCR:

Cinnamoyl-coa还原酶

计算机辅助设计:

肉桂醇脱氢酶

F5H:

FerulicAcid5-hydroxylase

CoAOMT:

Caffeoyl-coao-methytransferase

COMT的:

5-羟阿魏酸o-甲基转移酶/双特异性咖啡酸

高效液相色谱法:

高效液相色谱法

参考文献

  1. 1.

    胡文军,孙文杰,龙杰。抑制木质素生物合成促进转基因树纤维素积累和生长。生物技术学报。1999;17(8):808-12。https://doi.org/10.1038/11758

    中科院文章PubMed谷歌学者

  2. 2.

    张长兵,陈汉林,蒋娟。细根比粗根强的原因:纤维素和木质素在边坡稳定性中的作用。地貌学。2014;206(2):196 - 202。https://doi.org/10.1016/j.geomorph.2013.09.024

    文章谷歌学者

  3. 3.

    张晓明,张晓明,张晓明,等。一种新型纤维素合成酶基因(PtrCesA2)来自白杨木质部与拟南芥同源AtCesA7(irx3)与次生细胞壁合成相关的基因。基因。2020;296(1 - 2):37-44。https://doi.org/10.1016/s0378 - 1119 (02) 00864 - 8

    文章谷歌学者

  4. 4.

    张志强,张志强,张志强,等。纤维素合成酶的结构和功能基序(中国极限运动协会)面包小麦的基因(小麦l .)。Plos One, 2016; 11:1-18。https://doi.org/10.1371/journal.pone.0147046

    中科院文章谷歌学者

  5. 5.

    张志刚,张志刚,张志刚,等。玉米纤维素合成酶的分离与表达分析(中国极限运动协会)基因家族。纤维素。2004;11(3 - 4):287 - 99。https://doi.org/10.1023/b:cell.0000046417.84715.27

    中科院文章谷歌学者

  6. 6.

    吴志强,李志强,李志强,等。拟南芥纤维素合成过程中纤维素合成酶催化亚基的研究进展。植物细胞学报,2001;12(12):2529。https://doi.org/10.2307/3871246

    文章谷歌学者

  7. 7.

    吴志强,李志强,李志强不规则xylem3拟南芥基因座编码二级细胞壁合成所需的纤维素合成酶。植物学报。1999;11(5):769-80。https://doi.org/10.2307/3870813

    中科院文章PubMed公共医学中心谷歌学者

  8. 8.

    Bhandari S, Fujino T, Thammanagowda S.木质部特异性和张力应激响应共表达KORRIGAN杨树内切葡聚糖酶和三种次生壁相关纤维素合成酶基因。足底。2006;224(4):828 - 37。https://doi.org/10.2307/23389483

    中科院文章PubMed谷歌学者

  9. 9.

    杨超,李东,刘霞。R2R3-MYB转录因子OsMYB103L对水稻卷叶和机械强度的影响(栽培稻l .)。中国生物医学工程学报。2014;14(1):158。https://doi.org/10.1186/1471-2229-14-158

    中科院文章PubMed公共医学中心谷歌学者

  10. 10.

    李志刚,李志刚,李志刚。GT47家族糖基转移酶的研究进展。年度植物Rev. 2018; 41:65 5 - 83。https://doi.org/10.1002/9781119312994.apr0439

    文章谷歌学者

  11. 11.

    曾伟,兰普格纳尼,皮卡尔KL。芦笋IRX9IRX10,IRX14A是在高尔基体中形成的活性木聚糖骨架合酶复合物的组成部分。中国生物医学工程学报,2016;29(1):344 - 344。https://doi.org/10.1104/pp.15.01919

    中科院文章PubMed公共医学中心谷歌学者

  12. 12.

    Bonawitz ND, Chapple C.木质素生物合成的遗传学:连接基因型和表型。植物学报。2010;44(1):337-63。https://doi.org/10.1146/annurev-genet-102209-163508

    中科院文章PubMed谷歌学者

  13. 13.

    Silvia F, Montserrat C.改变木质素生物合成提高转基因玉米纤维质生物乙醇产量肉桂醇脱氢酶下调植物学报。2012;5(4):817-30。https://doi.org/10.1093/mp/ssr097

    中科院文章谷歌学者

  14. 14.

    Acker R, Vanholme R, Véronique S.木质素生物合成扰动影响次生细胞壁组成和糖化收率拟南芥.生物燃料。2013;6(1):46-7。https://doi.org/10.1186/1754-6834-6-46

    中科院文章PubMed公共医学中心谷歌学者

  15. 15.

    郭志刚,郭志刚,郭志刚。木质化改变转基因树的田间和制浆性能研究。中国生物工程学报。2020;20(6):607-12。https://doi.org/10.1038/nbt0602-607

    中科院文章谷歌学者

  16. 16.

    涂毅,罗什福尔,刘哲咖啡酸o甲基转移酶而且Cinnamoyl-CoA-Reductase多年生黑麦草的基因(多年生黑麦草).植物科学进展。2020;22(10):3357-73。https://doi.org/10.1105/tpc.109.072827

    中科院文章谷歌学者

  17. 17.

    王忠,李锐,徐娟。转基因柳枝草酶促糖释放的氢氧化钠预处理。中国生物工程学报,2012;https://doi.org/10.1016/j.biortech.2012.01.097

    中科院文章PubMed谷歌学者

  18. 18.

    José C, Prinsen P, Rencoret J.象草皮质和髓部木质素的结构表征(狼尾草purpureum)茎。农业食品化学学报,2012;60(14):3619-34。https://doi.org/10.1021/jf300099g

    中科院文章谷歌学者

  19. 19.

    Nyambati E、Nyambati M、Sollenberger L.饲粮中添加豆科干草对奶牛采食量和泌乳性能的影响。中国生物工程学报,2003;29(3):379 - 379。https://doi.org/10.1016/s0301 - 6226 (03) 00094 - 0

    文章谷歌学者

  20. 20.

    李志强,李志强,李志强。象草的热转化研究(狼尾草purpureum到生物气体、生物油和木炭。中国生物工程学报,2008;29(4):344 - 344。https://doi.org/10.1016/j.biortech.2008.02.039

    中科院文章PubMed谷歌学者

  21. 21.

    刘霞,沈勇,娄玲。生物质作物象草的耐铜性(狼尾草purpureum舒马赫)、香根草(香根草属zizanioides)和高地芦苇(芦苇南极光)。生物技术通报,2009;27(5):633-40。https://doi.org/10.1016/j.biotechadv.2009.04.017

    中科院文章PubMed谷歌学者

  22. 22.

    萨默维尔C,杨H,泰勒C木质纤维素生物燃料的原料。科学。2010;329(5993):790 - 2。https://doi.org/10.1126/science.1189268

    中科院文章PubMed谷歌学者

  23. 23.

    郭晓平,李志刚,李志刚,李志刚,等。油菜遗传多样性研究(狼尾草purpureum)通过SSR标记进行评估。中国农业科学,2015;7(7):147-55。https://doi.org/10.5539/jas.v7n7p147

    文章谷歌学者

  24. 24.

    王志强,王志强,王志强,等。同工酶数据在油菜指纹图谱中的应用(狼尾草purpureum用于种质资源管理。中国农业科学,29 (2)(2006);doi:https://doi.org/10.1007/s10722-004-6120-2

  25. 25.

    王志强,王志强,王志强,等。草属植物的亲缘关系(狼尾草purpureum使用AFLP标记对苗圃资源进行筛选。植物学报。2010;8(1):63-70。https://doi.org/10.1017/S1479262109990165

    中科院文章谷歌学者

  26. 26.

    周松,陈娟,赖军,殷刚,陈平。草类花青素代谢组和转录组综合分析及其生物合成调控狼尾草purpureum.工业作物,2019;138:111470。https://doi.org/10.1016/j.indcrop.2019.111470

    中科院文章谷歌学者

  27. 27.

    赵娟,夏斌,孟Y,杨忠,潘磊。基于转录组分析的金草根和叶对镉早期响应的分子机制(美国狼尾草×紫草).中华分子生物学杂志,2019;20(10):1-18。https://doi.org/10.3390/ijms20102532

    中科院文章谷歌学者

  28. 28.

    周峰,周永明,王永明。C4草作为纤维素生物燃料原料的遗传改良。中国生物医学工程学报。2009;45(3):291-305。https://doi.org/10.1007/978-1-4419-7145-6_7

    中科院文章谷歌学者

  29. 29.

    Dixon R, Sewalt V, Howles P.转基因烟草苯丙类途径的遗传操纵:作物改良的新基本见解和前景。生物技术生物技术装备。1996;1996(4):45-51。https://doi.org/10.1016/s0734 - 9750 (96) 00033 - x

    文章谷歌学者

  30. 30.

    黄刚,曾颖,魏林,姚艳。桑树黑皮花青素合成机制的比较转录组分析(桑属个Roxb.)和white (桑属阿尔巴l)果实基因型。BMC植物生物学2020;20(1)。https://doi.org/10.1186/s12870-020-02486-1

  31. 31.

    菅野,木岛。日本海参颜色变化的定量和定性评价Stichopus对虾.水产科学50 (1)(2002)63-69;doi:https://doi.org/10.11233/aquaculturesci1953.50.63

  32. 32.

    道格拉斯CJ。苯丙类代谢和木质素生物合成:从杂草到树木。植物科学进展,1996;1(6):171-8。https://doi.org/10.1016/1360 - 1385 (96) 10019 - 4

    文章谷歌学者

  33. 33.

    Kleczkowski洛杉矶。葡萄糖在植物中的活化和代谢通过udp -葡萄糖焦磷酸化酶。植物化学,1994;37(6):1507 - 15所示。https://doi.org/10.1016/s0031 - 9422 (00) 89568 - 0

    中科院文章谷歌学者

  34. 34.

    Martin LK, Haigler CH.低温阻碍了二次壁期棉纤维纤维素合成过程中葡萄糖向蔗糖的通量。纤维素。2004;11(3 - 4):339 - 49。https://doi.org/10.1023/b:cell.0000046420.10403.15

    中科院文章谷歌学者

  35. 35.

    约翰W,唐顿S,霍克JS。淀粉和蔗糖代谢的酶玉米叶子。植物化学。1973;12(7):1551 - 6。https://doi.org/10.1016/0031 - 9422 (73) 80366 - 8

    文章谷歌学者

  36. 36.

    陆霞,李超,王霞,张伟,夏涛。以象草和芦苇秸秆为原料,添加硫氧还蛋白-his- s酶促制糖。生物技术生物燃料,2019;12(297):1-11。https://doi.org/10.1186/s13068-019-1629-y

    中科院文章谷歌学者

  37. 37.

    徐波,路易斯L, Escamilla T, Sathitsuksanoh N.沉默4-香豆酸辅酶a连接酶,降低木质素含量,提高生物燃料生产可发酵糖产量。植物科学进展。2011;32(3):611-25。https://doi.org/10.1111/j.1469-8137.2011.03830.x

    中科院文章PubMed谷歌学者

  38. 38.

    李国强,李国强,李国强。l -苯丙氨酸解氨酶和肉桂酸4-羟化酶在烟草细胞悬浮培养中的过表达。21世纪植物生物技术与体外生物学。20 (1999)297-301;doi:https://doi.org/10.1007/978-94-011-4661-6_69

  39. 39.

    王志强,王志强,王志强,等。木质素生物合成。植物学报。1999;54(8):519-46。

    谷歌学者

  40. 40.

    秦玲,秦霞,陈勇,曾伟。棉花β-半乳糖转移酶1 (GalT1)表明半乳糖阿拉伯半乳糖蛋白参与控制纤维发育。植物J. 2016; 89:957-71https://doi.org/10.1111/tpj.13434

    中科院文章谷歌学者

  41. 41.

    卢霞,郑霞,李霞。纤维素酶在液态热水预处理玉米秸秆木质素上的吸附及其机理。生物技术生物燃料,2016;9(1):1 - 12。https://doi.org/10.1186/s13068-016-0531-0

    中科院文章谷歌学者

  42. 42.

    杜军,曹颖,刘刚。高固相浓度下木质纤维素酶解中传质限制对产率降低的影响。中国生物工程学报,2017;29(4):388 - 395。https://doi.org/10.1016/j.biortech.2017.01.011

    中科院文章PubMed谷歌学者

  43. 43.

    闸门A, Hanes B, Ruiz R, Scarlata C,闸门J.生物质中结构碳水化合物和木质素的测定。国家可再生能源实验室(NREL)实验室分析程序(LAP)的标准生物质分析。2007; 25:275 - 301。

  44. 44.

    刘艳,刘永华,曾勇,姜春。硼钙缺钙对三叶树砧木幼苗根系结构和细胞壁的影响。植物物理与生物化学。2019;144:345-54。https://doi.org/10.1016/j.plaphy.2019.10.007

    中科院文章PubMed谷歌学者

  45. 45.

    姜春。高效提取茶树中富含次生代谢产物的RNA,用于深度转录组测序和基因表达分析。生物技术学报。2019;44:345 - 54。https://doi.org/10.5897/AJB11.235

    中科院文章谷歌学者

  46. 46.

    Grabher R, Manfred G.来自RNA-Seq数据的全长转录组组装,没有参考基因组。中国生物工程学报。2011;29(7):644-52。https://doi.org/10.1038/nbt.1883

    中科院文章谷歌学者

  47. 47.

    F利民,N北芳,朱喆。CD-HIT技术用于下一代测序数据的加速聚类。生物信息学,2012,28(23):3150 - 2。https://doi.org/10.1093/bioinformatics/bts565

    中科院文章谷歌学者

  48. 48.

    Patro R. Salmon提供了快速和偏见意识的转录表达量化。光子学报。2017;14(4):417-9。https://doi.org/10.1038/nmeth.4197

    中科院文章PubMed公共医学中心谷歌学者

  49. 49.

    Davidson NM, Oshlack A. Corset:为新组装的转录组启用差异基因表达分析。中国生物工程学报。2014;15(7):410-32。https://doi.org/10.1186/s13059-014-0410-6

    中科院文章PubMed公共医学中心谷歌学者

  50. 50.

    Young MD, Wakefield MJ, Smyth GK。RNA-seq的基因本体分析:考虑选择偏差。中国生物工程学报。2010;11(2):1-12。https://doi.org/10.1186/gb-2010-11-2-r14

    中科院文章谷歌学者

  51. 51.

    张波,何伟。加权基因共表达网络分析的一般框架。中华生物医学杂志,2005;4(1):第17条。https://doi.org/10.2202/1544-6115.1128

    文章PubMed谷歌学者

  52. 52.

    朗菲尔德P,霍瓦特S. WGCNA:加权相关网络分析的R包。生物信息学杂志,2008;9(559):1-13。https://doi.org/10.1186/1471-2105-9-559

    中科院文章谷歌学者

下载参考

致谢

感谢深圳爱美烯研究所(中国深圳)在生物信息学方法方面提供咨询。

资金

本研究得到了齐鲁工业大学科教融合人才计划基金(No. 2018-81110268)、生物基材料与绿色造纸国家重点实验室基金(No. 2419010205、No. 23190444)的资助。资助机构为本研究提供了资金支持,包括实验设计和实施、抽样和数据分析。没有资助者在数据收集和分析以及撰写手稿方面发挥作用。

作者信息

从属关系

作者

贡献

WQZ、SKZ分别进行实验、数据分析和稿件撰写。XQL, CL, XWL, GYD参与了部分实验和数据分析。TX设计了这个项目,并参与了手稿的撰写,并批准了最终的手稿。

相应的作者

对应到夏道

道德声明

伦理批准并同意参与

本稿件未经伦理批准和同意方可参与。

发表同意书

不适用。

相互竞争的利益

作者声明他们没有利益冲突。

额外的信息

出版商的注意

施普林格自然对出版的地图和机构从属关系中的管辖权主张保持中立。

补充信息

附加文件1:

图S1。象草细胞壁形态的显微ct变化(a) T3-S1 (b) T3-S5

附加文件2:

图S2。组装基因的分布和注释统计。(a)组装基因的长度分布和汇总统计。(b)在三个GO类别中,单基因分布代表了最广泛的3级基因本体(GO)。生物过程(BP),细胞成分(CC)和分子功能(MF)。

附加文件3:

图S3。样本间相关系数热图。

附加文件4:

图S4。用WGCNA分析了在T1、T2、T3三个发育阶段共表达的3852组DEG。

附加文件5:

图S5。象茎中纤维素和木质素合成相关基因的RT-PCR分析。不同字母表示差异有统计学意义(ANOVA, Duncan < 0.05)。

附加文件6:

表S1。RNA测序数据及相应的质量控制。

附加文件7:

表S2。43个差异基因的GO注释用于WGCNA分析

附加文件8:

表S3。43个差异基因的KEGG注释用于WGCNA分析

附加文件9:

表S4。T3期43个基因在WGCNA中的表达水平和功能注释及其与木质素或纤维素合成的相关系数。

附加文件10:

表S5。RT-PCR引物列表。

附加文件11:

表S6。RNASeq与qRT-PCR数据的pearson相关分析。

权利和权限

开放获取本文遵循知识共享署名4.0国际许可协议,允许以任何媒介或格式使用、分享、改编、分发和复制,只要您对原作者和来源给予适当的署名,提供知识共享许可协议的链接,并注明是否有更改。本文中的图像或其他第三方材料包含在文章的创作共用许可协议中,除非在材料的信用额度中另有说明。如果材料未包含在文章的创作共用许可协议中,并且您的预期使用不被法定法规所允许或超出了允许的使用范围,您将需要直接获得版权所有者的许可。如欲查看本牌照的副本,请浏览http://creativecommons.org/licenses/by/4.0/.创作共用公共领域奉献弃权书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本条所提供的资料,除非在资料的信用额度中另有说明。

转载及权限

关于本文

通过CrossMark验证货币和真实性

引用本文

张,伟,张,生,陆,X。et al。组织特异性转录组分析揭示象草中木质纤维素合成的调控机制(狼尾草purpureumSchum)。BMC植物生物学20.528(2020)。https://doi.org/10.1186/s12870-020-02735-3

下载引用

关键字

  • 象草(狼尾草purpureumSchum)。
  • RNA-Seq
  • 京都基因和基因组百科全书
  • 加权基因共表达网络分析
  • 纤维素
  • 木质素