抽象的
背景
水松它生产抗癌药物紫杉醇,因此在中国被作为工业作物种植。aptala2 /乙烯反应元件结合蛋白(APETALA2/ erebp)是植物发育、生长和胁迫反应的关键调控因子。几种同系物控制紫杉醇的生物合成。鉴定AP2/EREBP蛋白水松对增加育种和生产并澄清他们的进化过程是很重要的。
结果
在来自多个的90个基因中红豆杉转录组数据集,81个编码的包含ap2的全长蛋白。在2个AP2、2 ANT、1 RAV、28个脱水反应元件结合蛋白和47个乙烯反应因子中发现了与被子植物AP2/ erebp高度相似的结构域,表明它们具有极其保守的进化过程。一个新的亚群蛋白TcA3Bz1包含三个保守的AP2结构域,是AP2/ erebp与已知蛋白不同的新结构域。新的AP2亚型蛋白也存在于几种裸子植物中(银杏)和苔藓植物(Marchantia polymorpha).但未发现同源物Selaginella Moellendorffii,表明这种植物的进化过程是未知的。此外,AP2/ erebp在苔藓植物和裸子植物中具有不同的保守结构域,如B3、zf-C3Hc3H和agent结构域。有趣的是,从苔藓到裸子植物的大部分新蛋白中,AP2结构域分别有三个重复,但gb_137的AP2结构域被复制。
结论
新的亚型AP2 / erebps具有不同的起源,并可以丰富我们对植物AP2 / ereBP转录因子的分子结构,来源和进化过程的知识。
背景
水松SPP。是一种古老的裸子植物,可以产生次级代谢物,紫杉醇(通用紫杉醇),最常用的临床抗癌药物[1那2那3.].水松紫杉醇是紫杉醇及其前体的主要来源,在我国许多省份作为经济作物广泛种植。而紫杉醇的含量水松SPP。非常低,生物合成途径高度复杂,需要19-20个酶促步骤,导致紫杉醇供应短缺。
调控次生代谢产物的生物合成是指导工业作物育种、基因操作和种植的一种有前途的方法[4.].我们以前的工作鉴定了两个AP2 / erebps蛋白,TCERF12和TCERF15,可以积极地和负面调节TASY编码紫杉醇生物合成途径中第一步酶的基因[5.].因此,鉴定AP2/EREBP转录因子水松SPP。将有助于筛查紫杉醇生物合成的候选调节剂。
AP2/EREBP转录因子在植物中发挥着多种作用。AP2/EREBP超家族蛋白被分为6个亚群,分别是APETELA2 (AP2)、AINTEGUMENTA (ANT),与ABI3/VP1 (RAV)、脱水反应元件结合蛋白(DREB)、乙烯反应因子(ERF)和大多数植物中的soloist [6.那7.].AP2和蚂蚁蛋白主要用作生殖和营养器官和横向器官发展中的关键发育调节因子[8.那9.].作为负调节剂,求求蛋白在非生物和生物应激期间介导植物防御[10那11那12].DREB通常在冷,干旱和热应力反应中起作用,ERF通常与生物应激反应相连,例如病原体发作和茉莉酸甲酯和乙烯应用[13那14].因此,AP2/EREBP转录因子的鉴定对进一步的培养具有重要意义。
AP2 / erebp是一种高度保守的超家族在植物植物中,但它的转录因子在裸子植物植物中尚未得到系统地研究。裸子植物更加古老,但与Anviosperms一样重要,并且通常在基因的进化过程中提供新的理解[15].因此,水松为研究AP2/EREBP蛋白在裸子植物中的进化过程提供了有价值的材料。
我们集成了多转录组数据集T.Chinensis.与紫杉醇生物合成有关,用于鉴定AP2 / ereBP转录因子[2那15那16那17].使用超过100 GB测序数据来确保通过隐马尔可夫模型(HMM)搜索获得大多数AP2 / ereBP蛋白。仅采用与至少完整AP2结构域编码的基因进行进一步分析。AP2 / eREBP蛋白也从Agiosperms获得(拟南芥),裸子植物(挪威云杉那银杏毕洛巴巴那Pinus TADAE.,Gnetum montanum)和苔藓植物(Physcomitrella金属盘和Selaginella Moellendorffii)来澄清进化上的差异。最后,分析了TcAP2/EREBP蛋白的表达模式,并与紫杉醇生物合成基因聚类。结果表明,AP2/EREBP转录因子的进化在高等植物中具有高度的差异性,这为AP2/EREBP蛋白的进化提供了有趣的发现。
方法
植物材料和转录组数据集
这T.Chinensis.2岁紫杉(红豆杉(皮尔格)Rehd.)和62# medium的亚文化[18].BGI(中国深圳)对一系列转录组数据集进行测序;以前报道了一些这些数据,例如NA / CA [16]及MJ治疗[17].还使用了两个未发表的数据集,单个大小为36 Gb,以及来自公开报告的重新组装的转录组数据[15那19].
鉴定AP2 / eREBP蛋白T.Chinensis.
本研究中的转录组数据来自我们之前报告的数据库,通过添加几个新的数据集,例如MiR5298OE和Wrky470(两个基因,MiR5298和Wrky47涉及紫杉醇生物合成的人被过度表达水松细胞及其转录组数据是高通量测序;未发表的结果)[2那16那17那19].大型数据集有助于获得令人生心的全长基因。
AP2/EREBP蛋白T.Chinensis.通过HMM V3.1B2中的HMM搜索标识(http://hmmer.org/)通过HMM v3.1b2 (http://pfam.xfam.org/)使用AP2域的隐马尔可夫模型(HMM)(PF00847),截止得分为1E-5 [20.].从不同的转录组数据集获得的所有核苷酸序列由CAP3进一步重组(http://doua.prabi.fr/software/cap3)[21]并通过CD-HIT-EST除去冗余,序列同一性切断为0.98(http://weizhong-lab.ucsd.edu/cdhit-web-server/cgi-bin/index.cgi?cmd=cd-hit -est.)[22].将无法扩展的序列与NR数据库进行比对,使用在线Blastx和默认参数(https://blast.ncbi.nlm.nih.gov/Blast.cgi).ORF查找器(https://www.ncbi.nlm.nih.gov/orffinder/),获得推导的全长蛋白序列。对于没有完整ORF的基因,使用包含AP2结构域的比对序列进行进一步的生物信息学分析。所有核苷酸和氨基酸序列可作为补充文件下载。
获得AP2 / eREBP蛋白答:芥那P. Paten.和美国moellendorffii,p .冷杉属,G. Biloba.
拟南芥从plnTFdb数据库(http://plntfdb.bio.uni-potsdam.de/v3.0/)[23].的蛋白质数据库P. Paten.和美国moellendorffii已从JGI下载(https:////phytozome.jgi.doe.gov/pz/portal.html#).蛋白质序列p .冷杉属和p . tadae从ConGenIE (http://congenie.org/),那些G. Biloba.从吉拉下载(http://gigadb.org/dataset/100209)和那些G. Montanum.从Dryad获得(https://datadryad.org/resource/doi:10.5061/dryad.0vm37.2.).采用HMM搜索方法筛选AP2/EREBP蛋白中含有AP2结构域,临界值为1e-5。HMM文件(PF02362,http://pfam.xfam.org/family/B3)用于鉴定AP2/EREBP蛋白中除AP2结构域外还含有一个B3结构域的RAV蛋白。
保守AP2结构域的序列比对及系统发育和基序分析
蛋白与MAFFT v7.312 (http://mafft.cbrc.jp/alignment/software/)[24]和默认参数的在线ClustalW,并由EsPript 3.0着色(http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi)[25].Mega 5.0用于构建基于1000释放重采样后的JTT模型的AP2域序列的邻接树[26].通过phyml 3.1验证树(http://www.atgc-montpellier.fr/phyml)[27].当ML和NJ树相似时,它们被用作系统发育树,由FIGTREE V1.4.3彩色(http://tree.bio.ed.ac.uk/software/figtree/).来自不同植物的AP2域的具体logo是在经典motif发现模式下使用MEME Suite V5.0.2 webtools生成的(http://meme-suite.org/tools/meme)[28].
全长ERF转录因子的系统发育分析
ERF转录因子是AP2 / EREBP蛋白,其仅包含AP2结构域,并构成AP2 / EREBP系列的最大亚家族。全长ERF蛋白T.Chinensis.与其他植物进行系统发育分析,以明确ERFs的差异水松和其他植物。Mafft用于对齐,Mega 5.0用于基于具有1000个引导重采样的JTT模型构建树。通过phyml 3.1验证树(http://www.atgc-montpellier.fr/phyml)[27].当ML和NJ树相似时,以ML和NJ树为系统发生树,FigTree V1.4.3 (http://tree.bio.ed.ac.uk/software/figtree/).B3 erf包含EDLL motif,使用ClustalW与蛋白重量矩阵“Identity”进行比对。使用phyML和FigTree对该树进行验证和着色。
ERF转录因子的Motif分析
全长氨基酸序列T.Chinensis.AP2/EREBP转录因子具有完整的orf和其他AP2/EREBP蛋白,利用默认参数的MEME软件分析AP2/EREBP转录因子,以识别不同植物中新的特异性基序。结构域和基序模式由TBtools (http://cj-chen.github.io/tbools.)[29]及WebLogo (http://weblogo.berkeley.edu/logo.cgi.).
的表达模式T.Chinensis.AP2 / erebp转录因子
水松spp.以其抗癌代谢物,紫杉醇而闻名。两个ERF因子,即TCERF12和TCREF15,调节紫杉醇生物合成。因此,将已知的紫杉醇生物合成基因加入到热线图中,以阐明AP2 / ereBP因子对紫杉醇生物合成的潜在调节作用。从样品中获得五种转录组数据,具有显着不同的紫杉醇含量。例如,NA包括新诱导和积累的水松细胞,而Ca包含长期传式细胞[16].采用FPKM (NA/CA, ga处理)、TPM (miR5298bOE和WRKY47OE)计算基因表达;紫杉醇生物合成相关的两个基因miR5298和WRKY47在紫杉醇中过表达水松细胞及其转录组数据是高通量测序)和RPKM(MEJA处理)。log2(表达式比率)的值用于使用morpheus生成和聚类Heatmap,默认参数(https://software.broadinstitute.org/morpheus.).使用Excel中的相关公式计算共表达系数值。
结果
共鉴定出90个AP2/EREBP基因T.Chinensis.转录组数据集
尽管根据BLAST结果,许多unigenes作为AP2 / EREBP转录因子被注释,但仅考虑可以编码全长AP2结构域的基因。冗余拆卸后,序列组件和伸长率,从206bp到6951bp的长度的93个基因可以编码至少一个全长ap2域(附加文件1和4.).在最近关于AP2 / ereBP的研究中,仅使用转录组数据发现近90个基因[30.那31].几水松未发现AP2 / erebps,表明严格调节几种AP2 / erebps的表达。
AP2-、ANT-和rav2型AP2/EREBP蛋白是少数T.Chinensis.
在90个基因中,81个unigenes能够编码146个aa ~ 1955个aa的AP2/EREBP蛋白1).
三个命名为TcAP2a-c的unigenes可以编码具有两个AP2结构域的独特蛋白(图2)。1一种)。TCAP2C的R1类似于称为Tcant2c的蚂蚁子组的R1(图。1) (9.].此外,tcrav1.用额外的B3结构域编码Rav蛋白,76个蛋白质仅包含一个AP2结构域。TCERF41,也被命名为TCWRI1,高度保守WRI1蛋白,仅包含一个AP2结构域,但具有不同的C末端AP2域样图案,其缺少(Y / H / W)LG-and RADD-MOTIF(图。1b) (32].ATWRI1 / 3/4具有两个保守的AP2结构域,但同源物具有高度变化的C末端AP2结构域(R2)Larix Gmelinii var。Olgensis,Larix Kaempferi,和佩戴尔亚洲人(无花果。1b) (29].然而,WRI同源物的R2与蚂蚁密切相关,表明WRI同源物在植物中具有特殊的进化过程[33] (图。1c)。
新的AP2 / ereBP,具有三个AP2结构域,在几个裸子植物和苔藓植物中发现
T.Chinensis.具有指定为TCA3BZ1的UNIGENE,其编码含有三个AP2,一个B3和一个ZF-C3HC3H结构域的蛋白质(PFAM13891)。与WRI1蛋白中的AP2中的发散C末端重复不同,TCA3BZ1中的三个重复全部用其他蛋白质的常见AP2结构域保守(图。2b)。GB_05581包含相同的域G. Biloba.(无花果。2a)。此外,Gb_11937也编码含有3个AP2结构域但没有B3或zf-C3Hc3H结构域的蛋白。在P. Paten.在美国,5个AP2- erebp蛋白包含3个AP2结构域,其中2个包含zf-C3Hc3H结构域,但不包含B3结构域。Pp3c7_17700V3.6。p在R1和R2之间包含一个Neurododullin_N超家族域(图1)。2裸子植物的)。p .冷杉属那p . tadae那G. Montanum.,和pteridophyte美国moellendorffii在美国,没有一种蛋白质含有两个以上的AP2结构域。
在NR数据库内的TCA3BZ1的同源搜索之后(2019/6/30版),假设的蛋白质Marpo_0093S0032(Genbank:PTQ32953.1)似乎是最相似的Marchantia polymorpha并包含三个AP2,一个B3和一个ZF-C3HC3H结构域。此外,PTQ32953.1具有B3结构域的N-末端的试剂域(图。2a).比对后,AP2结构域的三个重复序列都呈现高度可变。系统发育分析显示,除gb131937和Pc3Pv3.12-14外,R1、R2和R3分别进化。2c). gb1307的R2和R3重复序列的核苷酸序列完全相同,表明一个重复导致3个包含蛋白质的AP2域(图。2b,额外的文件2).
B3和zf-C3Hc3H结构域在这些新进化支蛋白中高度保守,但根据NR数据库(version 2019/6/30)的搜索结果(E-value >1e-5),与任何已报道的蛋白不同源。2d和f)。B3结构域也可以在Rav蛋白中发现,但与新的疏水蛋白的域不同(图。2d).含B3的蛋白被分为4类,LAV(叶状子叶2 [LEC2]-脱落酸不敏感3 [ABI3] -VAL)、RAV(生长素反应因子)、ARF(生长素反应因子)和REM(生殖分生组织),导致4个不同的B3结构域[30.那34].在这些蛋白中,REM类蛋白B3与其他三类蛋白距离较远。具有3个AP2结构域的新分枝蛋白B3与这4个B3重复位点的相似性较低(图3)。2d).然而,系统发育分析表明,新进化支蛋白B3与ARF虽然相似度较低,但有共同的祖先,表明TcA3Bz1及其同源物可以与ARF结合相似的顺式元件(图3)。2e)。
所有这些结果表明,AP2 / ereBP转录因子具有复杂的进化过程。据我们所知,本研究首先发现了具有三个或更多个AP2结构域的AP2 / eREBP蛋白和额外的结构域,例如ZF-C3HC3H结构域,其首先在AP2 / ereBP蛋白中鉴定。这些发现可能是关于AP2 / ereBP转录因子功能的有趣研究点。
DREB和ERF蛋白的AP2结构域在细胞内保守进化T.Chinensis.
仅含有一个AP2结构域的EREBP亚家族蛋白答:芥可分为13个划分,即两个子组,DREB(A1-A6),ERF(B1-B6)和独奏者[7.].许多植物只有1-2个独奏者[11那35那36那37].根据我们的结果,存在在AP2域中具有保守的HLG-MOTIF的独唱ERF,存在T.Chinensis.和p .冷杉属.然而,这种蛋白质在G. Biloba..因此,裸子植物中独唱erf的进化过程有待进一步研究。
76个EREBP全长蛋白的AP2结构域T.Chinensis.用16个代表性同源物分析了系统源性分析答:芥(无花果。3.c)。根据我们的结果,eRebp亚家族蛋白质T.Chinensis.可以分为10个支,其中T.Chinensis.[30.那38].只有一种蛋白质属于B2,B6和A1蛹。B3的人在T.Chinensis.具有21个ERF,而B4,B1和A5组分别包含13,11和10ERF(图。3.b)。在许多植物中,B3是ERF亚家族中大多数成员的主导人物[31那39那40那41].
在ERF和DREB蛋白中的保守主题T.Chinensis.
几乎全部水松ERFs和dreb的AP2域包含wlg motif, TcERF27将其转化为WLN(图)。3.b). WLG-motif在所有DREBs和ERFs中100%相同,甚至在RAVs中也是如此,但在AP2亚家族蛋白中转化为YLG [31那42].WLN-MOTIF的替代可能推断有趣的生物重要性。
所有B1 Tc1SF蛋白质在其C末端具有(L / F)DLNL / F(x)p型耳动型,其通常存在于B1 ERF中[43,可以认为是LxLxLx-和dlnxxp型增强的ear motif组合,允许TOPLESS共阻遏物进行物理相互作用(图)。4.a和c)[44那45那46].此外,在大多数tcerf中,一个dcdsss基序高度保守,存在于ear基序的n端,一些aterf属于B1分支(图1)。4.A和B)。
几个b3 tcerfs具有EDLL主题,首先在ATTR1的C-Terminus中找到,并用作强大的激活域[47].与未知B3 erf的EDLL基序不同,D残基不保守,而是被G或S残基取代水松B3 TcERFs。在ORA59、ERF1和ERF15中也发现了替换。5.).然而,这个14 aa motif中的两个L残基是与MED25物理相互作用所必需的,高度保守(图2)。5.额外的文件3.)[48].
中AP2/ erebp的表达谱T.Chinensis.
AP2/EREBP超家族是植物中最大的转录因子之一,是植物发育、生长、防御和一系列生物活性的关键调控因子[14那49].我们以前确定了两个调节紫杉醇生物合成的2个ERF,并获得了串联转录组数据集T.Chinensis.不同紫杉醇生物合成[15那16那17].这些数据集用于阐明TcAP2/ erebp的表达模式,筛选紫杉醇生物合成AP2/ erebp型调节剂候选。
在81个全长AP2/ erebp中,60、53和66在NA、MeJA-和ga处理的紫杉醇高产量的细胞中下调(图)。6.) (50].然而,在这些数据集中,B1的大部分成员作为重要的负调控因子被下调,如在NA细胞中有10个成员(90.9%)被下调,表明B1在这些生物活性中发挥着重要作用,可能与紫杉醇生物合成的增加有关[5.].这三种TcAP2s和TcRAV1可能在植物发育和防御系统中起重要作用,并在NA细胞中大幅度上调[51].另外,在17个差异表达的B3成员中有10个在Meja处理的细胞中上调,表明B3 Tcerfs在MEJA响应中发挥重要作用(图。6.一个额外的文件2).此外,27个全长AP2/ erebp与紫杉醇生物合成基因密切共表达,且系数值大于0.95,表明这些转录因子在紫杉醇生物合成中具有潜在作用(图)。6.b)。
讨论
AP2/EREBP转录因子以其保守的AP2 dna结合域命名,在植物整个生命周期的发育过程中发挥着不同的作用,是整合代谢、激素、基因调控网络的重要组成部分。以及逆境适应中的环境信号和各种植物生物活动中的逆行信号[4.那5.那49那51那52].AP2/EREBP超家族蛋白曾被认为是植物特异性转录因子。然而,一些HNH内切酶被发现含有一个AP2结构域,它选择性地识别聚(G)/聚(C)作为结合位点在蓝藻(Trichodesmium ererthraeum.),ciliate(Tetrahymena Hirtophilile.)和病毒(肠杆菌的噬菌体Rb49和噬菌体费利克斯01) [53].在植物中,AP2结构域的结合位点也是G / C-富含和高度相似的聚(G)/聚(C)拉伸[53].AP2/EREBP转录因子的DNA结合亲和力表明AP2/EREBP蛋白从病毒到植物的保守进化。
在植物中,AP2/EREBP超家族蛋白通常分为AP2、ANT、ERF、DREB、RAV和soloist亚群。AP2和ANT亚群包含两个以ylg基序为特征的保守AP2结构域。ERF和DREB只有一个包含AP2结构域的wlg基序。RAV除AP2域外,还有一个B3域。Soloists在AP2/EREBP蛋白中是最小的组,而DREB和ERF构成了几乎所有植物中最大的组[8.那11那30.那35那39].AP2 / EREBP蛋白的这些结构域结构在许多植物物种中保守地演化,尽管它们中的大多数是有神不痛的。然而,我们的结果表明,AP2 / EREBP蛋白质在裸子植物和苔藓植物中具有高度不同的进化过程和域结构。
发现了AP2/EREBP蛋白的一个新分支,其中包含3个保守的AP2结构域T.Chinensis.那G. Biloba.那P. Paten.,m . polymorpha(无花果。2).然而,蕨类植物美国moellendorffii没有这样的子组成员。这种AP2/EREBP蛋白在裸子植物中并不存在,如p .冷杉属那p . tadae,G. Montanum..此外,新亚群蛋白具有不同的结构域,构成其他保守结构域,如B3和zf-C3Hc3H结构域。通过转录组数据集进行鉴定后,T.Chinensis.只有一种蛋白质,名称为TCA3BZ1,其含有三个AP2,一个B3和一个ZF-C3HC3H结构域,并且仅发现TCA3BZ1的这种同源物M. polymorpha和G. Biloba.B3结构域位于三个AP2结构域的n端,而在RAV蛋白中,它总是位于c端[54].在G. Biloba.和P. Paten.在美国,大多数蛋白质都属于只有三个AP2结构域的新分支。另外两种蛋白质P. Paten.在三个AP2结构域的N-Terminus处包含额外的ZF-C3HC3H域。总之,AP2 / ereBP蛋白的新亚组仅存在水松SPP。,G. Biloba.和苔藓植物,这些蛋白质具有多样化的功能域,因此在高等植物中不同地发展。
B3结构域是DNA结合的基本要素,但不同的类别绑定各种顺式元素;例如,ARF绑定到5'-TGTCTC-3',RAV1识别5'-cacctg-3'[30.].虽然TCA3BZ1的B3具有常见的祖先,但它们分享了很少的相似性,导致其不同的结合特性[30.].特别是在TcA3Bz1 B3结构域中缺失了ARF B3结构域中RGQP(K/R)R-motif,而RGQP(K/R)R-motif是ARF识别相关顺式元件所必需的。2d),表明后者域绑定未知的CIS元素[30.].ZF-C3HC3H结构域几乎高度保守,几乎所有新的植物蛋白,但在该领域都有最小的信息,除了它是DNA装订[51那55].综上所述,这些新的分支蛋白,如TcA3Bz1,可能在植物中发挥新的功能。
AP2/EREBP蛋白各亚群在细胞中高度保守T.Chinensis.和Angiosperms,并且只有独奏型类型不存在。每个子组的AP2结构域与各种DNA CIS元素和功能不同地绑定[53].AP2结构域的YRG和RAYD-MOTIF分别负责DNA结合和蛋白质 - 蛋白质相互作用[52].在一些类型的蛋白质中,第一个残基Y和R有时会分别分化为F和M/L [42那56].此外,(H/Y/W) lg基序是区分AP2/EREBP亚群的典型保守基序,AP2和ANT中的YLG, soloist中的HLG, DREB、ERF和RAV中的WLG [11那31那57].在T.Chinensis.、YRG-、(Y/W/H)LG-和rayd -基序在普通亚型蛋白中也高度保守。AP2进化枝的TcAP2a&b和ANT进化枝的TcAP2c都包含在AP2和ANT蛋白的所有AP2结构域中保守的ylg基序[9.那31那57].大多数tcdreb、tcerf和TcRAVs都有wlg基序。
一个不同的是,YRG-and RAYD-MOTIF的第一个残留物之间变化T.Chinensis.特别是在rayd基序中,R被L/M/V/K/E/Q/I/Y/H所取代。3.).确定高度可变的rayd基序的影响T.Chinensis.由于有关RAYD-MOTIF和相关蛋白质相互作用的分子基础的有限信息,很困难。(y / w / h)lg-motif表现出比YRG和RAYD-MOTIF更好的保守主义T.Chinensis.,只有两种蛋白具有不同的基序,包括TcERF27的WLN-和tcwr1的R2 (c端AP2结构域)的ntg基序。所有这些结果表明(Y/W/H) lg基序在AP2结构域功能中具有重要作用(图2)。1)[57].
DREB (V14, E19)和ERF (A14, D19)之间的第14和19个残基存在差异,但第19个残基有时并不高度保守[5.那35那58].Tcdrebs和Tcerfs的外观也是根据这些结果的,并且只有Tcerf8和9(b4)和Tcerf48(b6)的v14残基类似于drebs(图。3.).进一步的验证可能有助于澄清V替代在TcERF8&9&48中的作用。
尽管观察到这些差异,但AP2结构域的进化是高度保守的T.Chinensis.和植物植物植物[6.那11那30.那31那35那36那38那39那40那41].综上所述,4个G(2个G来自YRG-和wlg基序,2个G来自G11和G52,图。3.a)和rayd基序的一个D残基非常保守,因此对AP2结构域至关重要(图2)。3.).然而,在这些新的亚群蛋白中,AP2结构域的三个保留基序和四个残基都是可变的(图2)。2).3个AP2结构域的AP2/EREBP新因子的存在和结构多样性表明AP2/EREBP蛋白在被子植物和其他高等植物中进化过程的复杂性。
B1和B3 erf的EAR-和EDLL基序也高度保守T.Chinensis..
随着EAR-MOTIF的存在,B1 ERF用作植物中的负调节剂。在T.Chinensis.,所有B1型tcerf均具有(L/F)DLNL/F(X) p型ear基序,该基序在其他植物的所有B1型erf中高度保守[43].Ear-Motif通常有两种类型,LXLXL和DLNXXP类型,例如Jaz,Aux / IAA和Ninja [41那46].(L / F)DLNL / F(X)P型可被认为是两种类型的增强耳动组合,可以增强负调节功能。TcARF12,B1 ERF转录因子,具有(L / F)DLNL / F(X)p型耳序,先前被证实为负调节器TASY紫杉醇生物合成中的基因(图。4.)[5.].
EDLL motif是一个短motif,有四个离散残基,具有较强的激活域,最早在AtERF98中发现[47那48].四个B3 tcerf在其c端含有与AtTDR1高度相似的EDLL基序,包括TcERF15,紫杉醇生物合成的正调控因子(图)。5.)[5.].进一步的研究表明,通过与Med25结合,ora59的两个L残基,尤其是ORA59的L228是必不可少的,而E和D残留物不保守[48那59].虽然不是所有B3 ERF,包括TCERFS,但都有保守的EDLL主题,大部分都是正稳压器;例如,Crorca3不包含C-Terminus EDLL主题,但可以激活表达式STR基因(附加文件3.)[4.].应该进一步阐明这些没有EDLL主题的B3 ERF的机制。
许多报道表征了各种植物中的AP2 / ereBP转录因子;DNA结合的AP2结构域在植物王国中的高度保守[11那39那41].此外,几乎所有AP2 / ereBP因子的亚型蛋白,包括AP2,Ant,Rav,DREB和ERF,存在Physcomitrella金属盘被子植物。大量分类揭示了AP2/EREBP转录因子在高等植物中的相同进化过程,但新分支蛋白的鉴定揭示了AP2/EREBP在高等植物中的不同进化过程。这一发现可能对我们重新认识植物界的物种形成具有重要的指导意义。
除了这三个保守的AP2结构域外,还有两个dna结合结构域,一个新的B3结构域和一个新的zf-C3Hc3H结构域,在所有新的AP2/EREBP蛋白亚型中都表现出了极端的保守性,这是本研究首次发现的。额外的dna结合域可能通过调节下游基因为这些新的分支蛋白提供新的功能。然而,由于B3-和zf-C3Hc3H结构域与已知的相关结构域存在很大的差异,因此很难确定这些新的分支蛋白在植物中的作用。由于AP2/ erebp在被子植物中不存在,因此AP2/ erebp可能在被子植物中发挥特定的作用Marchantia polymorpha和一些裸子植物。这样的突变系和基因操纵Marchantia polymorpha这些AP2/ erebp具有新的结构域,需要一些裸子植物来阐明它们的功能。
结论
鉴定和进化分析表明,AP2/EREBP转录因子在植物分化过程中具有复杂的进化过程。新发现的蛋白具有3个保守的AP2结构域,在高等植物中表现出不规则性。据我们所知,在被子植物和蕨类植物中未发现此类报道美国moellendorffii.并非所有裸子植物都有新的AP2分支蛋白;T.Chinensis.和G. Biloba.含有这种蛋白质,然而挪威云杉那Pinus TADAE.和G. Montanum.不要。对于苔藓植物,P. Paten.和m . polymorpha有这些新的蛋白质。此外,这些新的AP2蛋白的结构域在这些植物中也有所不同。这些结果表明,AP2/ erebp在植物中具有特殊的进化过程,而AP2/ erebp在植物中具有保守的进化过程T.Chinensis.和其他植物。新的亚组蛋白可能分开地从常见组中演变,并且在发散时,AgeniSperms和几个裸子植物可能会放弃新型AP2 / erebps。
可用性数据和材料
植物材料,红豆杉(皮尔格)Rehd.(凭证标本保存在中国科学院武汉植物园植物标本馆,登记号HIB0087305,付淑霞鉴定),由中国咸宁华威种苗农民专业合作社提供,该合作社允许我们将其用于科学研究。这水松细胞在我们的实验室中培养。原始测序数据在Geo数据库中提交(登录号:GSE28539)和SRA数据库(登录号:SRR1339463,SRR1339474,SRR1343578和SRR8083193至SRR8083198)。所有的蛋白质红豆杉我们使用的可以在附加文件中获得1.其他数据来自GenBank的公共数据库PTQ32953.1(登录号)。https://www.ncbi.nlm.nih.gov/pricein/ptq32953.1//),基因组Physcomitrella金属盘那Selaginella Moellendorffii来自JGI (https:////phytozome.jgi.doe.gov/pz/portal.html#).拟南芥从plnTFdb数据库(http://plntfdb.bio.uni-potsdam.de/v3.0/),挪威云杉和Pinus TADAE.从ConGenIE (http://congenie.org/),银杏毕洛巴巴来自Giga (http://gigadb.org/dataset/100209),G. Montanum.下载自DRYAD (https://datadryad.org/resource/doi:10.5061/dryad.0vm37.2.).
缩写
- 蚂蚁:
-
AINTEGUMENTA
- AP2:
-
Apetela2.
- DREB:
-
脱水响应元件结合蛋白
- EREBP:
-
乙烯响应元件结合蛋白
- 小块土地:
-
乙烯响应因子
- 遗传算法:
-
赤霉素酸
- 唔:
-
隐藏的马尔可夫模型
- Meja:
-
茉莉酸甲酯
- Rav:
-
ABI3 / VP1有关
- TASY:
-
税法合成酶
参考
- 1.
张敏,金鑫,陈勇,魏敏,廖伟,赵松,傅超,于林。TcMYC2a基因在紫杉醇合成中的调控作用红豆杉.前植物SCI。2018; 9:863。
- 2.
张M,Chen Y,Nie L,Jin X,Liao W,Zhao S,Fu C,Yu L.转录组型识别和筛选紫杉醇生物合成调控的腕表因素红豆杉.Sci众议员2018;8(1):5197。
- 3.
韦弗英航。紫杉醇/紫杉醇如何杀死癌细胞。中国生物医学工程学报。2014;25(18):2677-81。
- 4.
ORCA3是植物初级和次级代谢茉莉酸响应的转录调控因子。科学。2000;289(5477):295 - 7。
- 5.
关键词:紫杉醇,紫杉醇生物合成,tasy基因,茉莉酸响应因子,抑制因子红豆杉.植物mol biol。2015; 89(4-5):463-73。
- 6.
关键词:ERF,基因家族,全基因组分析拟南芥和米饭。植物杂志。2006;140(2):411 - 32。
- 7.
Sakuma Y,Liu Q,Dubouzet JG,Abe H,Shinozaki K,Yamaguchi-Shinozaki K. DNA结合特异性的ERF / AP2域拟南芥DREBs:参与脱水和冷诱导基因表达的转录因子。中国生物化学学报。2002;29(3):998-1009。
- 8.
曾玲,尹勇,尤晨,潘强,徐东,金涛,张斌,马辉。水稻AP2蛋白的进化及其相互作用十字花科:证据联系开发和环境响应。J Intent Plant Biol。2016; 58(6):549-63。
- 9.
Shigyo M, Hasebe M, Ito M. AP2亚家族的分子进化。基因。2006;366(2):256 - 65。
- 10.
付敏,姜香港,孙胜,Kim SK,南赫。的一个子集拟南芥RAV转录因子独立于ABA调控干旱和盐胁迫反应。植物生理学报。2014;55(11):1892-904。
- 11.
歌曲X,李啊,侯X.全面分析AP2 / ERF转录因子超家族在大白菜中(芸苔属植物拉伯ssp。学报).BMC基因组学。2013;14:573。
- 12.
B3 DNA结合超家族的进化:对REM家族基因多样化的新认识。《公共科学图书馆•综合》。2009;4(6)。https://doi.org/10.1371/journal.pone.0005791
- 13.
AP2/ERF家族转录因子在植物非生物胁迫反应中的作用。生物物理学报。2012;1819(2):86-96。
- 14.
Dietz KJ,Viehhauser A. AP2 / Erebp转录因子是基因调节网络的一部分,并在压力适应和逆行信号传导中集成代谢,激素和环境信号。原生质。2010; 245(1-4):3-14。
- 15.
张敏,陈勇,聂林,金旭,傅超,于林红豆杉JAZs。基因。2017;620:66 - 74。
- 16.
Zhang M, Dong Y, Nie L, Lu M, Fu C, Yu L. High-throughput sequencing reveals miRNA effect on primary and secondary production properties in the long- production sub培养水松细胞。前植物SCI。2015; 6:604。
- 17.
李斯特,张P,张米,富琴,赵思,董烨,郭艾,yu lj。转录概况红豆杉细胞对茉莉酸甲酯的反应。BMC基因组学。2012;13:295。
- 18.
张世士,梅XG,刘L,yu lj。增强的紫杉醇生产,由细胞悬浮培养中的elictors组合引起的红豆杉.Biotechnol Lett。2000; 22(19):1561-4。
- 19.
廖伟,赵胜,张敏,董凯,陈勇,付超,于林。新型细胞色素p450的转录组组装及系统鉴定红豆杉.前植物SCI。2017; 8:1468。
- 20.
Eddy SR.加速轮廓HMM搜索。计算机科学与技术。2011;7(10):e1002195。
- 21.
Huang X,Madan A. Cap3:DNA序列装配方案。Genome Res。1999; 9(9):868-77。
- 22.
黄颖,牛斌,高艳,付玲,李伟。CD-HIT套件:用于生物序列聚类和比较的web服务器。生物信息学,2010,26(5):680 - 2。
- 23.
Perez-Rodriguez P, Riano-Pachon DM, Correa LG, Rensing SA, Kersten B, Mueller-Roeber B. PlnTFDB:植物转录因子数据库的更新内容和新特征。核酸Res. 2010;38(数据库版):D822-7。
- 24.
Katoh K,Standley DM。Mafft多序列对齐软件版本7:性能和可用性的提高。mol Biol Evol。2013; 30(4):772-80。
- 25.
Robert X, Gouet P.用新的ENDscript服务器解密蛋白质结构的关键特征。核酸Res. 2014;42(Web服务器版):W320-4。
- 26.
田ura K, Peterson D, Peterson N, Stecher G, Nei M, Kumar S. MEGA5:利用最大似然、进化距离和最大简约法的分子进化遗传学分析。生物医学进展。2011;28(10):2731-9。
- 27.
最大似然系统发育估计的新算法和方法:评估PhyML 3.0的性能。系统医学杂志。2010;(3):59 307 - 21所示。
- 28.
Bailey TL, Boden M, Buske FA, Frith M, Grant CE, Clementi L, Ren JY, Li WW, Noble WS。MEME套件:motif发现和搜索工具。核酸Res. 2009;37: W202-8。
- 29.
Chen C,夏R,陈H,何Y.TBTools,生物学家的工具包与用户友好的界面集成了各种HTS数据处理工具;2018年。
- 30。
李旭,张东,高斌,梁艳,杨华,王颖,Wood AJ。荒漠苔藓AP2/ERF家族基因的转录组范围鉴定、分类和特征Syntrichia caninervis..前植物SCI。2017; 8:262。
- 31.
关键词:茶树,温度胁迫,AP2/ERF转录因子,转录组茶树).功能整合基因组学。2015;15(6):741-52。
- 32.
Cernac A, Benning C. wrinkle 1编码一个AP2/EREB结构域蛋白,参与调控贮藏化合物的生物合成拟南芥.工厂J. 2004; 40(4):575-85。
- 33.
Tang T, Du C, Song H, Aziz U, Wang L, Zhao C, Zhang M.全基因组分析揭示了植物中皱纹led1的进化和结构特征。MGG:分子遗传学和基因组学;2018年。
- 34.
Swaminathan K, Peterson K, Jack t,植物B3超级家族。植物学报,2008;13(12):647-55。
- 35.
du dl,hao rj,cheng tr,pan ht,yang wr,王j,张qx。AP2 / ERF基因家族的基因组分析李春万.植物MOL BIOL REP。2013; 31(3):741-50。
- 36.
壮吉,彭罗,程祖,张j,蔡b,张z,高f,朱b,傅xy,金xf等。基因组分析推定的AP2 / ERF家族基因葡萄.SCI Hortic。2009; 123(1):73-81。
- 37.
壮吉,蔡B,彭鲁,朱斌,金XF,薛义,高福,傅XY,田益,赵文等。AP2 / ERF基因家族的基因组分析Populus Trichocarpa..生物化学学报。2008;37(3):468-74。
- 38.
LICAUSI F,Giorgi FM,Zenoni S,OSTI F,Pezzotti M,Perata P.基因组和转录组的AP2 / ERF超家族葡萄.BMC基因组学。2010;11:719。
- 39.
李X,陶思,魏某,明米,黄X,张某,吴九。梨(Pyrus)AP2 / ERF基因的开采和进化研究。BMC植物BIOL。2018; 18(1):46。
- 40.
Du C,Hu K,Xian S,Liu C,风扇J,Tu J,Fu T.动态转录组分析显示,对油菜籽的冷应激负责的AP2 / ERF转录因子(芸苔属植物显著L.)。Mol Genet基因组学。2016; 291(3):1053-67。
- 41.
Rao G,Sui J,Zeng Y,He C,张J.全基因组分析AP2 / ERF基因家族Salix arbutifolia.FEBS Open Bio. 2015; 5:132-7。
- 42.
张女士,伯克林镭射唱片,Blancaflor EB,Sledge Mk,Sumner LW,Wang Zy。WXP1的过度表达,一种含药物Truncatula AP2含有域的转录因子基因,增加了切口蜡积聚,并增强了转基因苜蓿中的耐旱性(紫花苜蓿).工厂J. 2005; 42(5):689-707。
- 43.
董建华,刘约。拟拟拟拟含耳的蛋白质RAP2.1用作活性转录压缩机,以保持紧张控制下的应力响应。BMC植物BIOL。2010; 10:47。
- 44.
在小Physcomitrella中aux/IAA蛋白的突变研究揭示了其功能的新见解。新植醇。2018;218(4):1534 - 42。
- 45.
Pauwels L,Barbero GF,Geerinck J,Tilleman S,Grunewald W,Perez AC,Chico JM,Bossche RV,Sewell J,Gil E等。忍者将裸照与茉莉酸字信号传导连接。自然。2010; 464(7289):788-91。
- 46.
含ear基序的阻遏因子对防御和胁迫基因的负调控。植物科学进展。2006;11(3):109-12。
- 47.
马顺生,杨敏,杨志强,沈勇,杨志强,何浩丹,杨志强,等。EDLL基序:来自AP2/ERF转录因子的一个有效的植物转录激活域。工厂j . 2012, 70(5): 855 - 65。
- 48.
Cevik v,Kidd Bn,张PJ,山丘C,Kiddle S,Denby KJ,Holub EB,Cahill DM,Manners JM,Schenk PM,等。介质25用作拟南芥中己酸酯响应基因表达的一体化枢纽。植物理性。2012; 160(1):541-55。
- 49.
植物转录因子AP2/EREBP家族。生物化学杂志。1998;379(6):633 - 54。
- 50。
王某,李成,王海,钟XM,赵继,佟益,周YJ。Elictors,前体和代谢抑制剂对紫杉醇生产的影响水松cuspidata细胞培养。j林业库。2016; 27(6):1257-63。
- 51。
Li CW, Su RC, Cheng CP, Sanjaya YSJ, Hsieh TH, Chao TC, Chan MT. Tomato RAV transcription factor is a pivotal modulator involved in AP2/ erebp介导的防御通路。植物杂志。2011;156(1):213 - 27所示。
- 52。
AP2/EREBP转录因子在非生物胁迫下基因调控中的作用。2月。2001;498(2 - 3):187 - 9。
- 53。
Magnani E,Sjolander K,Hake S.从内切核酸酶到转录因子:植物中AP2 DNA结合结构域的演变。植物细胞。2004; 16(9):2265-77。
- 54。
刘义,元J,Ma H,Song J,Wang L,Weng Q. B3领域因素的表征与功能分析Zea Mays..应用电子学报。2015;56(4):427-38。
- 55.
dna结合蛋白结构域家族的序列和结构数据库的整理和分析。摩尔BioSyst。2015; 11(4): 1110 - 8。
- 56.
杨勇,董超,李晓霞,杜军,钱敏,孙旭东,杨勇。紫花针茅Ap2/ERF转录因子对紫花针茅抗旱性的影响拟南芥.植物细胞批准。2016; 35(11):2227-39。
- 57.
Kavas M,Kizildogan A,Gokdemir G,Baloglu MC。耐盐普通豆AP2-ERF基因家族的基因组调查及表达分析。Elli J. 2015; 14:1187-206。
- 58.
孙志明,周明民,肖兴国,唐义祥,吴义明。AP2/ERF家族基因全基因组分析莲花corniculatus.显示LcERF054增强耐盐性。功能整合基因组学。2014;14(3):453-66。
- 59.
李杰,张克克斯,孟义,胡锦涛,丁MQ,卞耶,燕麦,汉捷,周ml。茉莉酸/乙烯信号传导通过ORA59转录因子坐标羟基氨基酸酰胺生物合成。工厂J. 2018; 95(3):444-57。
确认
不适用。
资金
国家自然科学基金资助项目[批准号:31670293]。资助机构没有在研究的设计、数据的收集、分析和解释以及手稿的撰写中发挥作用,而只是提供资金支持。
作者信息
从属关系
贡献
MZ,CF和Ly构思了数据分析中的工作,YC,XJ,YC和YY,包括序列重新组装和完整的开放阅读框架识别。MZ和CF写了手稿。所有作者阅读并认可的终稿。
相应的作者
道德声明
伦理批准和同意参与
当局负责水松资源为九宫山国家级自然保护区,其提供了采集样品的许可;和华威种苗农民专业合作社(中国咸宁)提供了使用该种苗的许可T.Chinensis.用于我们的科学研究。
同意出版物
不适用。
利益争夺
两位作者宣称他们没有相互竞争的利益。
额外的信息
出版商的注意事项
Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。
补充信息
额外的文件1。
蛋白质序列水松AP2 / erebps。
附加文件2。
所有B3 erf序列比对。拟南芥B3 ERF从TAIR获得(https://www.arabidopsis.org/),而CrORCA3在登录号Q9LDB6下从UniprotKB下载。该CrORCA3缺失edll基序,被证明可以上调萜类吲哚生物碱的合成Catharanthus roseus也叫.
附加文件3。
PB_11937的部分核苷酸序列。GB_11937编码R2和AP2结构域的R2的核苷酸序列是完全相同的。红色字符编码了AP2域的R2和R3重复,黄色也完全相同,表明重复。
附加文件4。
的核苷酸序列水松AP2 / erebps。
权利和权限
开放获取本文根据创意公约署署署的条款分发了4.0国际许可证(http://creativecommons.org/licenses/by/4.0/)如果您向原始作者和源给出适当的信用,则允许在任何介质中进行不受限制的使用,分发和再现,提供指向Creative Commons许可证的链接,并指示是否进行了更改。Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本条提供的数据,除非另有说明。
关于这篇文章
引用这篇文章
张,米,陈,y。,金,X.et al。AP2/EREBP转录因子的起源和进化过程的新差异红豆杉.BMC植物杂志19,413(2019)。https://doi.org/10.1186/s12870-019-2044-z
收到了:
公认:
发表:
关键字
- 红豆杉
- APETALA2/乙烯反应元件结合蛋白转录因子
- TCA3BZ1
- 进化过程