跳到主要内容

基于高等植物丛枝菌根共生进化保护模式的新生物信息学管道

摘要

背景

涉及丛枝菌根(AM)共生的基因主要是通过突变体筛选确定的,其次是突变基因的鉴定(正向遗传学)。此外,一些am相关的基因已经通过其相关的表达模式被识别出来,它们的功能随后被敲除或敲除方法(反向遗传学)阐明。然而,作为功能冗余基因家族成员的基因,或具有重要功能并因此导致致命突变表型的基因,很难识别。如果这些基因是组成性表达,因此逃避差异表达分析,它们仍然是难以捉摸的。本研究的目的是系统地寻找am相关的基因与生物信息学策略,是不敏感的这些问题。我们的方法的核心元素是基于这样一个事实,即许多am相关基因仅在am能力物种中保守。

结果

我们的方法包括在AM活性宿主物种和非菌根物种的蛋白质组水平上进行全基因组比较。使用聚类方法,我们首先建立了同源/旁同源关系,随后确定了仅包含AM活性物种成员的蛋白质簇。然后在16种植物中分析这些簇的蛋白质,并根据它们在AM活性单子叶植物和双子叶植物中相对于非菌根植物的相关性进行排序。此外,我们将蛋白质编码序列的信息与基因表达数据和启动子分析相结合。因此,我们列出了一系列未经鉴定的蛋白质,这些蛋白质显示出与AM密切相关的序列保守性模式,这表明各自的基因可能在AM中的一个功能选择下。在这些候选基因中,有三个基因编码一个类似受体样激酶的小家族,它们与参与孢子体自交不亲和的S位点受体激酶有关。

结论

我们提出了一种新的基于蛋白质编码序列保护的基因发现系统策略。如果已建立基因组序列的物种属于在特定功能特性上不同的特殊群体,这种策略可以应用于其他多样的生物现象。

背景

大多数陆地植物与真菌共生(球囊菌门),并为它们的根部提供磷酸盐和其他矿质营养物质[1.]. 这种联系被称为丛枝菌根(AM),存在于陆地植物的大多数主要分类群中[2.],并被认为是在维管植物的早期祖先中单系出现的[3.].支持这一假设的最有力的论据是,菌根发育需要一个保守的信号通路,该通路由大约10个基因组成,它们编码SYMRK等受体成分和CCaMK等信号中间体[4.]. 参与这一途径的基因在单子叶植物和双子叶植物之间是保守的,也存在于石松和苔藓中[5.],[6.]这表明AM的起源可以追溯到早期维管植物在陆地被殖民的时候[3.].这一假设与化石记录是一致的,它为Rhynie燧石沉积物中类似am的组合提供了证据。据估计,Rhynie燧石起源于大约450年前的奥陶纪[7.].在AM进化后超过350 My,双子叶植物(Fabales, Fagales, Cucurbitales, Rosales)的一个小子集的后续事件,允许出现一种新的共生形式,根结共生(RNS)与根际细菌[8.] - [10]. 有趣的是,RNS以及放线菌与蓝藻内共生体的共生[11],[12],涉及与AM相同的信号通路,因此被称为共同共生信号通路(common SYM pathway)[4.],[13]. 共同SYM途径的一个核心要素是钙尖峰,即核周钙浓度的一种节律性变化,它被钙和钙调素依赖性蛋白激酶(CCaMK)感知和传递,以诱导共生基因表达[14],[15].

AM由超过80%的血管植物形成[1.],表明该协会提供了非菌根植物的显着选择性优势。然而,一些植物分类群不形成AM,其中包括Brassicaceae.最具特色的模式植物物种拟南芥,和藜科具有重要的经济作物品种甜菜属(甜菜)。am相关基因在am敏感植物中通常较为保守,而在非菌根植物中则较少保守,甚至缺失。这种现象已经被描述过了VAPYRIN(VPY)是真菌感染和真菌摄食结构(丛枝菌)发育的基础矮牵牛截形苜蓿[16],[17]. VPY在非菌根植物中完全缺失[16] - [18],同样的情况也适用于许多在AM中特异性表达的基因[19],[20].这种保护模式之分也观察到基因等大型无处不在的基因家族的成员ABC转运蛋白阻碍ARBUSCULE (STR)和STR2,或GRAS-type丛枝MYCORRHIZA1所需的转录因子(RAM1),都属于亚科是局限于胜任植物物种(21],[22]. 类似地,非菌根模式物种缺少共同SYM途径的几个组成部分拟南芥[6.],而他们在AM主管的Dicots和单子叶中保守。

传统上,AM相关基因要么通过突变筛查,然后对突变基因进行表征(正向遗传学),要么通过转录谱分析,然后对AM诱导的基因进行突变分析(反向遗传学)。随着植物基因组测序数量的增加,非菌根植物基因组中AM相关基因的缺失可以作为比较基因组学检测AM相关基因的一个标准。这第三种基因发现方法可以潜在地识别AM相关基因,这些基因由于功能冗余、致死表型或组成性基因表达而无法通过传统的遗传方法进行表征。从概念上讲,这种方法代表了一种减法程序,其中非菌根植物的蛋白质组,如A. Thaliana.从am敏感植物的蛋白质组中减去,得到一组在am敏感植物中一直保守的蛋白质,而非菌根参照植物中没有。

在这里,我们描述了一种新的方法来确定新的AM相关基因的基础上基因组减法。该方法包括一个多步骤的程序,使用蛋白质序列保护和基因表达作为富集潜在共生相关基因的标准。我们比较了一组6种AM活性被子植物(番茄茄、块茎茄、葡萄、截形苜蓿、大豆、毛果杨)和三种非AM物种(拟南芥拟南芥,拟南芥兰迪拉塔和芸苔属rapa)最初的聚类方法产生了一组潜在的候选蛋白质,约占整个蛋白质组的10%。在第二步中,基于基因表达模式对这些基因进行聚类截形苜蓿提供了一组在AM中诱导的保守基因。最后,为了集中于保守的组成性表达基因(例如共同的SYM基因),保守基因的蛋白质组群到扩展的蛋白质组群(包括单子叶植物)允许对E值进行定量统计,因此提供了一组在AM活性植物物种中比在非菌根植物物种中更为保守的蛋白质Brassicaceae.. 这一策略通过了一系列已知的AM相关基因的验证,这些基因通过了我们的选择方案。由此产生的AM相关蛋白的预测列表将通过反向遗传方法进行功能测试。

结果

am相关基因的序列保护模式

为了探索AM相关基因的差异保守性,我们建立了AM相关蛋白的系统发育,即丛枝菌根1(RAM1)所需的GRAS型转录因子,它是AM共生的重要调节因子[21]磷转运蛋白4(PT4)是共生磷转运和丛枝功能所必需的[23],[24](附加文件1.:文件S1)。RAM1的系统发育树显示出菌根植物(A组和B组)和非菌根植物(C组)之间的明显二分(图)1.a).值得注意的是,AM-competent双子叶和单子叶(a组和B组)的序列明显比彼此之间的双子叶(a组和C组)的序列更接近。在PT4及其在各种单子叶和双子叶物种的系统发育树中观察到类似的模式(图)1.b).与RAM1一样,来自am能力双子叶(A组)和单子叶(b组)的同源物比与am能力双子叶(A组)和非菌根双子叶(C组)的系统发育相关类群的同源物更紧密地聚在一起。

图1
图1

AM相关基因与家政相关基因的系统发育分析。am诱导的RAM1系统发育图(一)和PT4(b)与细胞周期蛋白D6的管家基因有关(c)和rpl5.(d)

观察到对比模式,当分析两个家庭基因时,编码细胞周期蛋白D6和叶绿体核糖体蛋白L5(图1.与单子叶植物相比,双子叶植物与单子叶植物之间的关系更为密切(图1)1.综上所述,这一证据表明,PT4和RAM1以及其他am相关基因可能在am敏感物种中处于多样化选择中。因此,am相关基因可以根据其编码蛋白的相对保守模式进行识别。

鉴定蛋白质系统发育的层次聚类

为了系统地鉴定AM相关基因,我们首先应用聚类软件Hieranoid[25]六个态度的蛋白质组序列,即截形苜蓿(地铁),大豆(GMA),vitis Vinifera(Vvi),番茄茄(狡猾),茄属植物tuberosum(Stu)和毛果杨三种非菌根植物,即拟南芥(阿瑟),rabidopsis lyrata.(阿丽),以及油菜(胸罩)。根据相关植物物种的概念系统发育树进行成对聚类(附加文件2.:图S1;附加文件3.:文件S2,脚本P0_HieraProcedure.txt)。数字2.描述我们战略的工作流程。简而言之,9种物种的蛋白质片用于聚类。过滤所得树质/旁骨蛋白的树木,得到蛋白质群的蛋白质群集,其满足某些已定标准称为Task3,Task4,Task9(参见下一节)。进一步加工这些基因列表以基于基因表达,对蛋白质编码区的保护和启动子序列进行分离am相关基因,如以下部分详细讨论。涉及不同进程的脚本(图中的p0,p1,p2,p3和p42.)载于附加档案3.S2:文件。

图2
figure2

基于序列保守的am相关基因鉴定策略。该流程图反映了基于其在蛋白质水平上的序列保守性模式、基因表达模式和其启动子中预测的调控元件的潜在AM相关蛋白的逐步鉴定。Sp:植物种类。P0-P4对应于补充材料(附加文件)中提供的协议、文件或脚本4.:文件S3)。蓝色框:数据库;绿色盒子:工具和流程;粉红色盒子:中间输出;红色框:最终输出。

在最初的一轮聚类之后,我们注意到,出乎意料的是,在Hieranoid生成的树中没有发现已知的AM相关的VAPYRIN蛋白,尽管据信它通常出现在所有AM活性植物中[17],[26],而它不在Brassicaceae.[16],[18].从Enembl仔细检查MTR蛋白质的检查显示,Vapyrin以及两种与之相关的基因蓖麻和PT4m . truncatula蛋白质组(数据库:Ensembl植物版本20)。但是,它们可以在Uniprotkb数据库中识别[27],并加入Mtr蛋白质组(VAPYRIN: Mtr_D3J162;CASTOR: Mtr_D6C5X5;PT4: Mtr_AAM76743.1), hieroid重启。从9种植物的蛋白质组中最终聚类得到28 ' 528簇同源和/或同源蛋白(图2.额外的文件4.:文件S3)。

选择具有潜在am相关蛋白的簇

为了在所有由Hieranoid生成的聚类中选择显示am相关蛋白已知的保守模式的聚类(图1.a、b),我们执行在网上通过选择至少包含6种AM活性物种中的每一种的一种蛋白质,但不包含非菌根物种Ath、Aly和Bra的蛋白质簇进行减法(任务6)。为了解释个别蛋白质可能因蛋白质组不完整而缺失的情况(如m . truncatula毒死蜱、蓖麻和PT4;参见上文),我们还对包含至少5种AM活性物种蛋白质的簇进行了更为宽松的搜索,但没有来自3种非菌根物种的蛋白质(Task5),我们还对Task4和Task3进行了相应的减法(图3)2.,P1;请参阅附加文件中的P1\u hieranoid\u output\u treatments.sh3.:文件S2)。

通过这些过滤器的群集数量列于表中1.. 在所有过滤试验中,m . truncatula的数量明显低于其他物种,表明其蛋白质组比其他am敏感物种的蛋白质组不完整(表1)1.).因此,要解释的不完全性m . truncatula对于其他可能缺失的蛋白质,我们选择了Task4鉴定的聚类进行进一步分析。

表1过滤后的层次聚类得到的蛋白质聚类数

为了评估Hieranoid聚类和随后过滤的效率,我们测试了已知的AM相关基因是否通过选择过程。我们组装了AM中已知函数和/或表达式模式的23个蛋白的列表(附加文件5.:表S1,附加文件6.:文件S4)。它们要么是共同SYM信号通路的组成部分(基因1-9),要么是结瘤因子和潜在myc因子(NFP)的受体,要么是AM发育中特殊需要的基因(RAM1, RAM2, STR),要么是菌根根中特殊诱导的基因(基因14-19)。另外一组蛋白作为阴性对照,预计不会通过筛选,要么因为它们作为管家基因,因此无处不在(PT1, PT6),要么因为它们主要参与结瘤,但不参与AM(结瘤信号通路1;NSP1)。

正如预期的那样,SYM信号通路的大部分(5/8)成分通过了Task4(附加文件)应用的过滤器5.:表S1)除了DMI1 / Pollux和Nucopocorins Nup133和NENA之前的核偶,尼纳,以前所知A. Thaliana.[28] - [30.]. NUP85在分层聚类过程中丢失,因此不能在此上下文中使用。此外,LysM型受体激酶以及RAM1和RAM2被保留,而ABC转运蛋白STR被排除在外。AM期间诱导的或仅在菌根根中表达的基因也通过过滤保留,但微丝酶和PR10除外,后者由稍远的近亲(附加文件中的MTR\ U 2g035150)表示5.:表S1)。重要的是,通过滤波消除了消除了阴性对照(由组成型表达基因编码的蛋白质或通过染色的基因编码的蛋白质)(附加文件5.:表S1)。这些结果表明,我们的聚类和筛选程序有可能基于蛋白质序列的保守性来识别AM相关基因。事实上,STR被删除,尽管它的保护模式,预计将允许它通过我们的过滤方法[22[可以解释它是它是大型基因家族(ABC转运蛋白)的一部分。

通过基因表达模式鉴定am相关蛋白

AM相关基因在AM发育过程中的诱导作用可能被识别。AM相关基因表达的全基因组分析已经在许多植物物种中进行,包括m . truncatula,l .对虾,S圣女果(番茄),水稻(大米)和矮牵牛[19],[31.] - [35.]. 大量的转录组学数据可以在网上找到m . truncatula(苜蓿基因图谱;http://mtgea.noble.org/v3). 我们利用这一资源在Task4产生的蛋白簇中鉴定了AM期间在转录水平诱导的那些蛋白簇。我们首先为Task4保留的所有树(2327个簇)提取那些来自m . truncatula(1362集群)。这些聚类共代表2117个基因m . truncatula,其中1618个基因中至少有一个Affymetrix探针m . truncatula基因阿特拉斯(MTGEA)。删除不可靠的探针(参见方法)后,表达数据为1526 m . truncatula代表1054个蛋白质簇的基因用于进一步分析。

表达数据可从各种条件下获得,包括菌根根根瘤菌不规则苔藓球茎,激光显微解剖根皮质细胞与丛枝R不规则.此外,接种根的表达数据没有发出感染3.(DMI3.)突变体36.],[37.]用myc因子(mycLCO)处理6h和24h的根和低磷处理的根都是有效的。这些处理和相应的对照处理下的基因表达值是从Medicago根据6个标准计算诱导率的基因图谱(表2.). 为了集中于菌根中被强烈诱导的蛋白质,采用3倍的诱导阈值进一步筛选候选基因。额外的文件中提供了由Task4确定的基因的完整列表,其相应的表达率符合标准1-67.S2:表。

表2.用于基因表达过滤的标准m . truncatula在Task4中发现的基因

组合分析显示,65个基因通常在菌根和微切割的丛枝细胞中被诱导,而26个基因仅在菌根中被诱导,173个基因仅在微切割的丛枝细胞中被诱导(图1)3.额外的文件8.:表S3)。只有7个基因在处理6 h后被mycLCO诱导,而处理24 h后没有一个基因被保留(图)3.). 有趣的是,有10个基因在DMI3.CCaMK缺失的突变体,表明它们的表达不受共同SYM途径的调控。其中3个基因也在AM根、微解剖的丛枝细胞和缺乏p的根中被诱导(表1.,标准6)(图3.). 探索这些基因是如何在缺乏基因的情况下被诱导的将是一件有趣的事情DMI3

图3
图3

维恩图m . truncatula基因在不同的am相关条件下上调。附加文件中列出的基因7.:表S2 (Task4)按照表中列出的标准进行组合分析2.. 红色区域,菌根诱导基因;绿色结构域,6h后Myc-LCO诱导的基因;深蓝色结构域,激光显微切割的带有丛枝的皮层细胞中诱导的基因;浅蓝色结构域,在DMI3.mutant(与Table2.). 标准5(MF-24小时)没有产生任何结果。根据标准6鉴定的基因用红色标记。列表A、B和C分别显示在附加文件中8.:表S3。

虽然基因表达模式可以根据定义的条件(如本研究中的标准1-6)来识别,但通过聚类的全局表达分析可以识别在一套大的表达数据中具有相似表达模式的基因组,如254种不同的处理和条件Medicago基因图谱(http://mtgea.noble.org/v3). 这种方法可以识别共同调控的基因组,因此可能是功能相关的。另一方面,这种方法可以导致在启动子中发现共同的调控元素,这是共同调控的原因(见下文)。因此,我们决定使用成对平均连锁和皮尔逊相关来鉴定具有共享表达模式的基因(图1)2.,P2段;请参阅附加文件中的P2_task4cytoallr.cys3.:文件S2)。通过Task4鉴定出的所有蛋白,通过标准化的基因表达评分进行关联,即个体表达水平之间的比值除以所有表达水平的平均值作为表达的相对指标(见方法)。特别关注的是包含am诱导基因的基因组。一个明显的集群51基因与一个显著相关的表达模式被证明是高度特异性的AM,导致明显的垂直红色条纹在集群的视觉表示(附加文件9:图S2和图4.).另一个相关的组包括在AM和RNS中普遍诱导的基因(附加文件10:图S3和附加文件11:图S5)。这些基因可能编码在共生相互作用中起一般作用的蛋白质。有趣的是,该聚类主要由几丁质酶、半胱氨酸蛋白酶、一种葡聚糖酶和几种成熟相关蛋白组成(图)5.).

图4
装具

详细的am相关基因簇显示在附加文件9:图S2。分级簇包含菌根中诱导的基因。“标准”列中的数字表明在哪些条件下,基因被诱导至少3倍(与表相比2.).“任务”列中的数字表示基因仍然保留在哪个任务中(与表相比)1.).根据菌根根部的基因诱导(对应于附加文件中的等级)来分配等级7.:表S2)。

图5
figure5

在菌根和根瘤共生中诱导的基因簇。其他文件中显示了集群的详细信息8.:表S3。“标准”一栏中的数字表明在何种条件下基因至少被诱导了3倍(与表1相比)2.).“任务”列中的数字表示基因仍然保留在哪个任务中(与表相比)1.).根据菌根根部的基因诱导(对应于附加文件中的等级)来分配等级7.:表S2)。

Anuiaperms中蛋白质相对保护分析

在相互作用期间诱导AM中具有作用的许多基因。这包括营养转运蛋白,例如am相关的磷酸盐转运蛋白[23],[38.] - [40](见上文),氨转运体AMT2 [41.],以及转录因子RAM1等调控成分[21].相反,涉及相互作用早期步骤的基因是组成思考的。例如,Nod因子受体(NFR)和常见符号基因的表达在Petunia的AM发育期间没有显着改变[19],与他们在Symbiont识别和信令中的早期功能一致。

为了确定在AM发育中具有潜在作用的组成性表达基因,我们决定在AM相关的三个植物类群:AM活性双子叶植物(a组)、AM活性单子叶植物(B组)和非菌根双子叶植物(C组)的背景下比较蛋白质的相对序列保守性(与图1比较)1.a、b)。为了避免由于蛋白质组不完整而遗漏相关基因,我们选择了相对开放的Task3作为该方法的聚类(至少包含6个am敏感物种中的3个同源物种,但没有一个非菌根物种)。首先,利用MAFFT对Task3保留的单个簇中所代表的序列进行多序列比对(MSA)计算[42.]其次,这些MSA共有序列被用作查询,通过psi-blast搜索用于Hieranoid聚类的蛋白质组以及一些单子叶植物物种,即o.苜蓿(Osa),玉米(Zma),乌拉尔小麦(土耳其),高粱(印度国家银行),普通大麦(Hvu),Brachypodium distachyon(BDI),和Aegilops Tauschii.(Ata) (B组)(图2.P3;参见附加文件中的P3_psiblastProcedure.txt3.:文件S2)。

然后通过Wilcoxon检验比较各组间的E值(图1)2.P4;看到P4_eval_wilcox。附加文件中的R3.:文件S2),以确定C组和A组之间,或C组和B组之间的e值群体存在显著差异的基因(附加文件12:表S4)。对于存在显著差异的蛋白质,取三组之间的e值平均值,计算C/A与C/B的对数(10)之比,作为am相关序列保守的相对度量(保守率)。保护率越高,说明非菌根同源物相对于适菌根物种的同源物与一致序列的距离越远,说明与am相关的保护效果越好。建立保存比的频率分布显示,我们的几个测试基因,如SYMRK、VAPYRIN、RAM1、RAM2和PT4通过了这个过滤器(图)6.a),因此它们的序列保存模式与参与AM共生的能力显著相关。令人惊讶的是,没有一个测试基因通过了非菌根双子叶和菌根单子叶的比较(图6.b) 尽管至少VAPYRIN、RAM1和PT4在AM活性双子叶植物和单子叶植物之间的关系比AM活性双子叶植物和非菌根双子叶植物之间的关系更为密切[16)(图1.a、b)。

图6
figure6

相关植物类群中潜在AM相关蛋白的保藏率均为平均值,且非AM类群与AM类群之间存在显著差异。直方图表示来自psi blast的E值的log10比率的频率分布。psi blast的查询序列是根据Task3的结果计算MSA一致性序列生成的。这些查询序列针对AM活性双子叶植物(A组)、单子叶植物(B组)和非菌根双子叶植物(C组)(与附加文件比较)12:表S4)。为了得到保守性比率,分别对A、B和C组的E值进行分组平均,并生成以下比率:C/A和C/B。仅当组间差异显著时,才包括保存率(p < Wilcoxon检验为0.05,与附加文件比较12:表S4)。(一)log10(C组)/log10(A组)的比率。(b)log10(C组)/log10(B组)的比值。注意8个控制基因来自另外的文件5.:表S1通过了过滤器(一),而没有通过(b)

由于Wilcoxon检验的显著性阈值排除了许多基因,我们寻求一种评估AM相关保守程度的替代方法。代替固定的阈值水平,我们定义了一组家庭蛋白质的保守性比率,这些蛋白质在保守性方面没有表现出AM相关的偏倚。为此,我们从Hieranoid簇中提取了所有植物的代表性同源物,包括AM活性和非菌根物种(Task9的结果;附加文件13:表S5)。因此,这个集合包含保守的看家蛋白,可以作为Task3确定的蛋白质保守模式的参考。我们以与Task3鉴定的蛋白质相同的方式进行,即基于每个蛋白质簇的6个AM活性物种计算MSA一致序列,并且这些MSA序列被用作针对所有蛋白质组的psi blast查询。正如预期的那样,以这种方式选择的大多数基因显示出一种保护模式,与所有双子叶植物与单子叶植物之间更紧密的系统发育关系一致(附加文件)13:表S5)。这一事实反映在房屋保持基因Cyclin D6和RPL5的系统发育树上(图1.a和b),它们也表示在Task9(附加文件13:表S5)。

我们从任务9的结果中选择了一组150个蛋白质,中间体E值(不包括E-VALUE = 0),并且在大多数单焦点中表示的基因(不包括在附加文件中标记的基因标记13:表S5)。对于这150个基因(在附加文件中用黄色标记14:表S6),计算Task3获得的基因的比率(见上文)。这些值往往更倾向于负值,这反映了Brassicaceae.MSA共识序列中与Task4获得的蛋白相关的同源物。因此,由Task9产生的150个内参基因定义了管家蛋白的保存比例范围,因此允许定义包含与am相关的保存偏差的蛋白的范围(附加文件14:表S6)。

全局比较Task3和Task9鉴定的蛋白质的保守率,发现前者的保守率要高得多(图)7.),反映了Task3和Task9选择的蛋白之间的不同保守模式。在A组(AM-competent dicots)和C组(non-菌根dicots)的比较中,am相关基因RAM1和PT4从内控控制基因cyclin D6和RPL5中明显分离出来(图)7.a),虽然B组(AM-竞争力单码)和组C组(图)之间的比较,但这种区别得多少得多7.b)。这些结果表明,节约率可以用作比较代理,以评估相对于非菌根物种相对于非菌根物种的给定蛋白质的相对保护程度。

图7
figure7

植物相关类群中am相关蛋白与管家基因的保护比平均值。如图所示,生成了保护比率6.(见图例)6.).但是,没有进行统计,并且显示了所有的比率。对Task3(绿色)提取的潜在am相关蛋白和Task9(红色)鉴定的潜在管家基因的保存率进行比较。为便于比较,请参照图中所示蛋白质的位置1.表示为(RAM1:AES78316;PT4:AAM76743;细胞周期蛋白D6:AES67335;RPL5:AES80278)。(一)log10(C组)/log10(A组)的比率。(b)log10(C组)/log10(B组)的比值。

会议结果在网上减法的方法

本研究的目的是根据AM活性植物和非菌根植物的直系同源基因的保护模式来鉴定AM相关基因。这种方法特别针对在共生过程中不被诱导的AM相关基因,因此,我们将重点放在Task3识别的在基因水平上不被诱导的蛋白质上(附加文件14:表S6)。为了评估该方法的效率,该列表根据平均值之间的E值比率排序Brassicaceae.和am胜任的双子叶植物,分别(附加文件14:表S6)。该列表按降序排列,因为保存率的最高值表明AM活性物种之间的蛋白质保存程度高于AM活性物种和非菌根物种之间的蛋白质保存程度。在这个列表中,第一个蛋白质,一个预测的α-葡萄糖苷酶/木糖酶,被选择来详细评估其保守性模式。事实上,一个系统发育树如图所示1.显示了一个极端偏斜的保护模式,具有AM能力的单子叶植物和双子叶植物的一个明确的共同分支,包括基本谱系Amborella trichopoda.而所有的非菌根物种Brassicaceae.,和B庸俗作为代表藜科,形成一个离群群(图8.a) 是的。

图8
figure8

一种高保守性α-葡萄糖苷酶的系统发育分析。在预测的am相关蛋白列表中,第一个被发现的是α-葡萄糖苷酶(AES81209,附加文件12:表S4)。的S圣女果序列用于检索广泛物种中最接近的同源物(附加文件)1.:文件S1)进行系统发育分析。(一)如图所示的树1.以番茄α-葡萄糖苷酶(Solyc03g094020.2.1)作为查询,利用blastp对非冗余蛋白质数据库在NCBI鉴定的每个物种的第一次命中率。(b)番茄Solyc03g094020.2.1所有同源基因的树(S圣女果)、葡萄藤(v葡萄)、杨树(p . trichocarpa),m . truncatula,和A. Thaliana.. 注意AM相关分支(GlucƏ1)没有来自的同系物A. Thaliana..最接近的拟南芥同系物(在gluc1处)离我们很远。

水解酶通常由基因家族编码,α-葡萄糖苷酶/木糖酶也是如此。为了测试AM相关保护模式的成员是否在AM有能力的物种中形成一个专门的类群,我们从NCBI的蛋白质数据库中分离出该物种的所有同源物v葡萄,p . trichocarpa,S圣女果,m . truncatulaA. Thaliana..他们在每个物种中编号基于他们的相似性与am相关的同源物S圣女果.系统发育树显示,所有具有am能力的物种都有一个am相关的同源基因,从而形成一个明显的am相关分支(图1)8.b) 是的。最接近的同系物拟南芥属于包含其余序列的大序列。因此,A. Thaliana.仅缺失α-葡萄糖苷酶/木糖酶基因家族的AM相关形式。

寻找潜力独联体am相关基因启动子中的 - 调节元素

除了ORF的保守性外,我们还通过寻找潜在的氨基酸序列来研究AM相关基因的非编码上游序列独联体-在共生过程中可能控制基因活性的调控启动子元件。我们选择了m . truncatula由Task4鉴定出的蛋白在菌根中至少比非菌根对照中诱导了3倍以上(图3.额外的文件7.:表S2与标准LCM或AM >3;190个基因)。启动子序列(起始密码子上游2 kb),下载自ensemble bl Plants BioMart (http://plants.ensembl.org/biomart/martview)并用模式识别软件MEME进行了分析(http://meme.nbcr.net/meme/doc/cite.html)代表过多的序列。第一次搜索揭示了一系列保守的预测启动子元件(附加文件)15:图S4a)。高度保守的元素包括核心序列GGGGTTCGAACCCC(MYC1元素),粗体字母几乎不变(附加文件15:图S4,附加文件16:表S7)。这个元素的回文性质,以及许多独联体-植物启动子中的元素是回文[43.] - [45.]促使我们专门搜索回文序列。有趣的是,第一次搜索预测的10个元素中有7个被第二次搜索的回文(附加文件15:图S4b,与附加文件比较15:图S4a)。除了Myc1元素外,出现了第二个具有明确核心序列tgagctagctca(Myc2元素)的元素(附加文件)15:图S4)。一个具有完全不变序列的元素是回文GCCGGC,它倾向于位于ATG(附加文件17:文件S5),表示它代表相关的启动子元素(附加文件17:文件S5)。除GCCGGC元素外,之前没有描述任何预测元素。我们的模因搜索可能会产生一个与AM相关的CTTC元素(序列:CTTGTTC),也称为MYCS元素[46.],[47.].该元素存在于am相关的磷酸盐转运蛋白基因的启动子中,并且am相关的圈套Ljvti12 [46.],[47.]然而,在190个AM诱导的启动子序列中,MEME并没有发现它。这个令人惊讶的结果促使我们在VAPYRIN启动子中寻找它,这是在两种植物的菌根中诱导的,m . truncatula矮牵牛[17],[19],表明该启动子可能含有保守的AM相关启动子元件。事实上,我们在来自各种单子叶植物和双子叶植物的14个毒死蜱基因的所有启动子中发现了CTTC元件的扩展版本(序列GACTTGTTC),这表明它在AM相关基因调控中具有更广泛的意义(数据未显示)。

选择Myc1和Myc2、GCCGGC和CTTC基因进行进一步的基因组统计分析m . truncatula.为了估计它们在am相关基因启动子中的相对频率,我们选择了三个样本:Task4中识别的基因的启动子(n = 1547), Task4中am诱导的基因的启动子(n = 190),以及所有的启动子m . truncatula(n = 46014)。这些启动子序列被blast搜索为四个感兴趣的元素的存在。对于非回文的CTTC元素,两个方向都被单独考虑,两个各自的较长变体(GACTTGTTC及其反向补充)也被包括在内(附加文件16:表S7)。实际上,与统计预期相比,COMPORY MYC1和MYC2以及GCCGGC元素的基因显着超越,并且相对于所有启动子的观察到频率(附加文件)16:表S7)。当考虑am诱导的基因时,过多的代表性甚至更加明显(附加文件16:表S7)。二项检验证实了这些结果的显著性。与Myc1和Myc2元件以及GCCGGC元件相比,当考虑其原始序列时(CTTGTTC), CTTC元件在由Task4识别的启动子中没有过多的代表,在am诱导的基因中仅占中等比例(附加文件)16:表S7)。然而,在Task4识别的基因启动子和am诱导的更多基因中,较长形式(GACTTGTTC)在两个方向上都明显过多16:表S7)。这表明较长的版本是CTTC元素的相关形式。

讨论

在过去的十年中,对AM-或rns缺陷突变体进行了许多筛选,并确定了大量参与信号传递和共生功能的基因[4.].此外,转录性分析已经鉴定了许多和RNS相关的转录物,然而,它们中的少量仅通过反向遗传方法表征。大多数这些遗传研究的中央发现是,参与共生的基因在竞争性物种中良好地保守,而它们在较小的程度上被保守,或者完全缺失,如非菌根种类A. Thaliana.. 基于这一发现,我们设计了一个策略,以编码区的保守性为主要标准,为第三条途径来识别尚未被发现的AM相关基因。我们比较了AM活性植物和非菌根植物的蛋白质组,从而分离出仅在AM活性植物中或在更高程度上保守的蛋白质。从本质上说,这种方法代表了在网上脱髓液方法,其中非菌根物种的蛋白质蛋白质从AM富集物种的蛋白质组减去,以产生预期富含am相关蛋白质的蛋白质组的一部分。

由于功能是在蛋白质水平上选择的,并且由于DNA水平上的序列保守性受到遗传密码简并性的影响,我们在蛋白质组水平上比较了物种。理想情况下在网上减法将涉及等量的AM-competent和非菌根组的蛋白质组。然而,由于AM在自然界的广泛成功,非菌根物种是例外(估计10-20%的被子植物物种),只有少数已经排序到一定程度,他们可以用于这种方法。作为非菌根物种,仅限A. Thaliana.,答:lyrata,和B拉帕作为Ensembl数据库中的蛋白质。相比之下,各种各样的am-promistent物种可用,其中包括各种Dicots(豆类,茄属植物,肉草等)和谷物。因此,在第一种方法中,我们选择了两名竞争力的单峰(o.苜蓿,美国二色的)、四名am胜任的双盲(S圣女果,v葡萄,m . truncatula,和G最大值)和两种非菌根植物A. Thaliana.B拉帕

该方法的第一步是建立八个选定物种的蛋白质组之间的同源关系。这项任务是用Hieranoid完成的,Hieranoid根据先前定义的相关物种的系统发育树,以分层的逐步程序建立同源/旁同源蛋白质簇。接下来的步骤是确定在所有或大多数AM活性物种中有成员的蛋白质簇,但在非菌根物种中没有。然而,在首次使用Hieranoid之后,我们注意到在许多情况下,已知单一蛋白质的同源树落入单子叶树和双子叶树中,从而阻止了我们的策略。因此,我们决定只使用双子叶植物进行聚类,即G最大值,m . truncatula,p . trichocarpa,v葡萄,S圣女果,和美国tuberosum以及三种非菌根植物A. Thaliana.,答:lyrata,和B拉帕(见附加文件2.:图S1)。为了评估程序的效率,我们使用了一些已知的am相关基因和一些内务基因作为参考(附加文件5.:表S1)。

所有9个蛋白质组的聚类结果共有28'528个蛋白质簇。随后选择仅在AM活性物种中含有直系同源物的簇建立了第一组潜在的AM相关蛋白(图1)2.,任务6)。为了解释一个或两个蛋白质组中个别同源基因缺失的情况,我们放宽了筛选的严格性,同时考虑到1个或2个AM活性物种缺失的簇(分别为Task5和Task4)(表4)1.,图2.). 一个更为宽松的过滤器(Task3)用于获得大量蛋白质,这些蛋白质随后根据E值的比较进行氨基酸序列保守性的定量评估(图3)2.额外的文件12:表S4,附加文件13: S5和附加文件14:S6)。Task3和Task4产生相当长的候选蛋白质列表(>1000簇)这一事实并不被认为是一个问题,因为随后的过滤和排序将列表进一步缩小(见下文)。

下一步是使用基因表达作为选择的标准,因此,我们定义了与AM相关的表达率(表1)2.).根据这些标准,我们对Task4鉴定的蛋白质列表进行了排序。通过采用严格的3倍诱导阈值,我们将分析限制在菌根中具有强大转录诱导能力的基因(图)3.额外的文件7.:表S2)。除了已知的am相关蛋白如pt4,am3,vapyrin,ram2和IPd3之外,该清单包括几种有趣的蛋白质,如Lysm受体激酶Lyr1,其近似的同源物莲藕节点因子受体NFR5 [48.,以及一些ABC转运体和肽转运体,它们可能在AM的发展中发挥作用。在AM中高度诱导的未知功能的候种包括三酰甘油脂肪酶(MTR_7g081050.1),中性神经酰胺酶(MTR_3g079190.1),一种在鞘脂代谢中起作用的酶[49.]网织蛋白氧化酶(mtr7g034740.1)是一种参与生物碱中间产物网织蛋白生物合成的酶[50.]. 事实上,许多已知的AM诱导基因是通过我们的选择程序恢复的(附加文件7.:表S2和S3)通过比较系统发育方法记录基因发现的潜力。

本研究的主要目的是基于编码序列的保守,即不依赖于am相关基因的诱导来鉴定新的am相关蛋白。为了获得am感受态物种开放阅读框(ORF)保护的定量指标,我们对6个am感受态物种(MSA)的保守一致序列进行二次过滤,将其与双子叶、单子叶、地苔等植物蛋白质组进行比对卷柏,苔藓Physcomitrella金属盘和单细胞藻类衣藻reinhardtii. 将这三种低等植物包括在内的兴趣是基于在地衣和/或苔藓中发现了几种AM相关基因的发现[5.],[6.],可能揭示了低等陆地植物共同SYM途径的进化起源[8.].用相对允许的任务3(含有6个AM主管物种中至少3种的蛋白质簇的蛋白质簇的结果进行Psiblast。通过这种方法,鉴定了1329个蛋白质,其中三种相关植物物种之间的e-值分别在非菌根物种和AM主管性的双斑点和单焦点之间具有显着不同(Wilcoxon测试,P <0.05)(附加文件12:表S4,图6.),表明它们在am敏感物种中保存得特别好。有趣的是,这50个p值最低(即am相关保守度最高)的蛋白中,有13个蛋白注释为受体、蛋白激酶、磷酸酶、抗病蛋白或g蛋白调控蛋白,暗示了它们在信号转导中的作用。

鉴于AM在植物营养中的重要作用,一种高度保守的铵转运蛋白(附加文件12:表S4,排名572)和低矿质营养转运体Nramp5(排名495)特别值得关注。铵是氮被认为是从AM真菌转移到植物的形式[51.],[52.]因此,铵转运蛋白在AM中尤为重要[41.]. 其他矿物质营养素如锌和铜的转运蛋白还有待鉴定。许多保守的蛋白质在苔类中也被发现是很好的保守S莫莱多菲,有些甚至长在苔藓上p .金属盘,鉴于C莱因哈特被证明在系统发育上更加遥远(附加文件12:表S4)。

为了获得与AM相关的保守性程度的直接定量测量,我们定义了保守性比率,它表示非菌根物种和AM活性物种(分别为双子叶植物或单子叶植物)之间来自psiblast(如log10)的平均E值的比率(附加文件14:表S6a)。为了进行比较,Task9的结果(在所有物种中发现的蛋白质)被作为普遍保守的管家蛋白质的代表。保存率越大,非AM植物和AM活性物种之间的蛋白质序列差异越大。因此,由Task3鉴定的蛋白质大多为正值,而管家蛋白(Task9)则为中性或负值(图3)6.7.).特别感兴趣的是保存比率为>100的蛋白质,它们包括PT4和RAM1(图7.a),已知显示与am高度相关的保护模式(图1.).关于保存比率的一般概述(附加文件14: Table S6a)的结果显示,对于220个蛋白质,无法计算保存比率,因为在非菌根物种的psiblast结果中完全缺失了它们(NaN in Additional file)14:表S6a)。此外,还有272个蛋白质的保守性比率大于100,表明AM相关的保守性很高。为了确定一个范围,在这个范围内,保护率可以被认为是向AM活性物种倾斜,Task9(houskeeping基因)鉴定的150个蛋白质被包括在Task3的结果中作为参考(见附加文件)14:表S6a;黄色标记的蛋白质)。

在从非菌根物种中缺失的220个蛋白质中(附加文件14:表S6a), 123有未知函数。有趣的是,三种蛋白分别是预测几丁质酶(TASK3_1488, TASK3_1548, TASK3_1649)和葡萄糖酶(TASK3_566, TASK3_581, TASK3_4113),表明它们可能在细胞壁修饰或信号转导中发挥作用。三种预测的CLE肽(TASK3_3616, TASK3_3634, TASK3_4020)可能参与了am相关的信号传导,正如在RNS中显示的那样[53.]. 共生信号中的一个已知成分包括DMI3(IPD3)/CYCLOPS(task31003)的相互作用蛋白,该蛋白是由DMI3[54.] - [56.].对于AM和RNS都需要的VAPYRIN (TASK3_795)也发现了很高的保守率[16],[17],[26]像毒死蜱(task31469)。

16种蛋白质显示出>100的两个保存比率(附加文件14:表S6B),即它们在相对于非菌根物种中的兼职性的Di​​cots和单焦点之间受到高度保守。特别感兴趣的是,编码预测的α-葡糖苷酶的任务3_196(附加文件12:表S4和附加文件14: S6b),在一些分类为α-木糖苷酶(如XP_006358190.1 in .美国tuberosum).虽然缺少保守的蛋白质A. Thaliana.(图8.A),存在在所有检查的植物物种中发生的相关糖苷酶,包括A. Thaliana.,表明非菌根模型物种只错过了与AM相关的同种型(图8.b)。α-葡萄糖苷酶或α-木糖苷酶在AM中的潜在作用是未知的,但鉴于木糖在细胞壁的半纤维素中的重要贡献[57.]它可能参与AM感染过程中细胞壁的改变[20].有趣的是,Petunia的预测α-木糖苷酶是在高磷酸盐条件下最强烈的压抑基因,抑制了AM [19].

在16个具有高保守性比率(>100)的蛋白质中有5个代表受体和蛋白激酶,其中3个(task3354、Task3î238和task34055)是密切相关的受体样蛋白激酶(RLK)(补充文件14:表S6b)。它们类似于S位点受体激酶(SRK)[58.],介导孢子体自交不亲和Brassicaceae.[59.]和玉米受体激酶ZmPK1 [60].系统发育分析表明,它们确实属于一个在所有am敏感物种中都存在的大的蛋白质支系,但在非菌根物种中保守性相当低(附加文件11:图S5)。氨基酸序列中一个保守的富含C的延伸在三个AM相关的RLK之间共享,也与SRK和ZmPK1共享(附加文件18:图S6),表明它们可能具有类似的由半胱氨酸桥介导的三级结构。有趣的是,ZmPK1型在根和幼苗中表达,而不是在花组织中表达[60]提示该受体激酶家族除了具有自交不亲和性外,还具有其他功能。综上所述,α-葡萄糖苷酶/木糖苷酶和RLKs的例子表明,我们的方法可以识别具有AM相关保守模式的蛋白质,即使它们是大家族的成员。此外,三个相关RLK的案例突出了我们的方法识别蛋白质的潜力,这些蛋白质可能由于功能冗余而逃避基因突变筛选。

转录主要由独联体-作用于基因启动子中的调控序列。因此,共同调控的基因可能在它们的启动子中共享共同的调控元件。基于这一逻辑,我们对190个am诱导基因的启动子进行了筛选,以获得可能具有代表性的过代表序列独联体-作用调节启动子元件。预测程序MEME发现了两个新的回文元件(Myc1和Myc2元件),并发现GCCGGC元件在am诱导的启动子以及Task4识别的基因的启动子中都有过多的代表。统计分析证实了这些元素在am相关启动子中的过度代表(附加文件16:表S7)。与其他相当不寻常的长度(分别为14 nt和13 nt)强调元素myc1和myc2的统计学意义独联体-作用元件的长度通常小于10nt[61]. 此外,元素Myc1和Myc2通常是耦合的(参见附加文件)17:文件S5),强调了它们与am相关基因诱导的相关性,并提示它们可能协同作用。

GCCGGC元件在ATG起始密码子上游500bp范围内的优势位置也表明了功能相关性。GCCGGC元件可与参与细胞缺钾反应的乙烯反应启动子中的转录因子RAP.2.11结合拟南芥[62],它被归类为伤口和病原体诱导[63].GCCGGC是共同GCC元件(sequence GCCGCC)的一个回文变体,广泛存在于致病相关基因的启动子和各种植物的乙烯响应启动子中[64] - [70]. 事实上,GCC元素存在于不同的变体中,这些变体被乙烯反应因子家族转录因子的特定成员所识别[69].在am相关启动子中GCCGGC元件的过度代表可能解释了水稻、马铃薯、矮牵牛花、欧芹等植物的菌根根转录组中预测的应激和病原体相关转录本的频率,m . truncatula,和l .对虾[19],[32.] - [35.],[71] - [73].

令人惊讶的是,am相关的CTTC/MYCS元素(序列:CTTGTTC) [46.],[74在190个am诱导的启动子中,MEME没有发现。此外,它在由Task4产生的基因中没有过多的代表,在am诱导的基因中只有适度的代表(附加文件16:表S7)。然而,一种扩展形式(GACTTGTTC)被发现明显过度代表,表明这可能代表了am的完整诱导元素m . truncatula. 关于预测的启动子元件在所分析的启动子中的出现的概述在附加文件中提供19:表S8。

综上所述,我们已经确定了两个新的潜在AM关联独联体-调控启动子元件。此外,我们发现GCCGGC元件是一种潜在的AM相关元件,可能表明乙烯参与了AM的发育,并且我们提出了CTTC元件的一种修饰(延长)形式。未来的工作将涉及这些要素对AM发展和功能的功能相关性,

结论

我们描述了一种非靶向的方法,通过全基因组比较分析AM活性植物和非菌根植物来鉴定新的AM相关基因。这一方法的有效性已经被从AM活性植物的基因组中鉴定出许多已知的AM相关基因的发现所证实。根据这一策略,我们根据编码序列的保守模式、基因表达模式和预测的调控启动子元件,鉴定了许多新的可能与AM相关的基因。这些基因将被进一步评估其预测的功能(途径),其保守性的程度,以及拷贝数,或者在基因家族的情况下类似基因的数量。这一过程将产生一个简短的基因列表,这些基因将通过基因插入突变进一步进行功能分析P杂交,m . truncatulal .对虾使用已建立的转座子相关协议[74] - [76].

方法

系统发育序列分析

图的系统发育序列分析1.9使用附加文件中提供的蛋白质序列进行1.S1:文件。为了获得这些序列,每个组的第一个序列(在附加文件中以粗体标记)1.:文件S1;e、 通用汽车公司。使用truncatula RAM1(用于RAM1组)作为NCBI对非冗余蛋白质数据库的蛋白质爆炸的查询。从这次爆炸的结果来看,每种植物的第一次撞击都被发现了。系统发育分析如前所述[77]基本功能(“一键式”)。系统发育树分支上的红色数字代表近似似然比检验(aLRT)的指数[78]. aLRT值相当于引导值,表示支持良好的分支(接近1)或支持较弱的分支(接近0)。

图9
figure9

AM反应基因启动子调控元件的预测。在菌根或带有丛枝的微解剖细胞中(图中红色和蓝色区域),显著上调了Task4中所代表的190个基因的启动子(>3x),通过MEME鉴定出启动子元件3.额外的文件8.:表S3)。搜索设置为6-30个核苷酸的回文序列。

数据库

为了与Hieranoid聚类,我们从Ensembl Plants网站(www.ensemblgenomes.org; 数据库版本20)[79]:拟南芥(阿瑟),rabidopsis lyrata.(阿丽),油菜(胸罩),截形苜蓿(地铁),大豆(GMA),vitis Vinifera(Vvi),番茄茄(狡猾),茄属植物tuberosum(Stu)和毛果杨(Ptr)。蛋白质组数据库包含Ath的35387个蛋白质,Aly的32668个,Bra的41026个,Mtr的46020个,Gma的73320个,Vvi的29928个,Sly的34676个,Stu的56211个,Ptr的45779个。三个蛋白质序列(PT4,蓖麻和VAPYRIN)参与菌根的发育和功能,在菌根的蛋白质组中缺失m . truncatula因此,在使用MtGEA进行聚类和进一步分析之前,将其添加到fasta Mtr文件中。为了计算保存率(见下文),下载了以下其他物种的蛋白质组:水稻(Osa),玉米(Zma),乌拉尔小麦(土耳其),高粱(印度国家银行),普通大麦(Hvu),Brachypodium distachyon(BDI),和Aegilops Tauschii.(Ata)。

用Hieranoid进行同源/同源推理

用Hieranoid软件对蛋白质组进行聚类分析[25],它是基于由系统发育树引导的两两分层方法(附加文件2.:图S1)。该树的分支之间的相对距离与层次无关,因此,它们被任意设置为4。在一个称为层次正交推理的启发式过程中,只考虑树的拓扑结构。产生的同源蛋白序列簇保存在一个名为eudicotyledons.OGTree.txt的文件(附加文件)中4.:文件S3,脚本P0_HieraProcedure)。使用Newick实用程序[80]在六种非芸薹科植物中只保留至少包含X序列的簇,但缺乏所有三种芸薹科蛋白质组的直系同源物(附加文件4.:文件S3,P1\u hieranoid\u output\u treatment.sh)。相应的结果被命名为TaskX。

基因表达数据

所有的表达数据都是从截形苜蓿基因表达图谱(MtGEA version 3;http://mtgea.noble.org/v3) [81],[82].从表中列出的治疗中的表达值2.,根据标准1-6 (Table2.). 用于该方法的这些问题集涵盖了1110个蛋白质簇,即Task4产生的所有簇中的大约48%(见表)1.). 为了去除不可靠的探针集,那些带有扩展名“\u x\u at”和“\u s\u at”的探针被排除,这意味着在基因组中不是唯一的,或者分别识别多个相似基因的探针。此外,如果与目标序列不完全一致的问题集的“基因组一致性因子将同一问题集中的所有探针都考虑在内”低于70%(MtGEA、MGAG基因到Affymetrix基因芯片的映射),则删除这些问题集。这项研究共产生了1526个Mtr基因,代表1054个蛋白质簇(Task4鉴定的所有簇的45%)。

ClusterMaker

为了根据共享的表达模式对基因进行聚类,开源软件Cytoscape v. 2.8.3 [83]与ClusterMaker插件一起使用[84]处理MTGEA的微阵列数据。与如下方式的比例分数法则标准化 - 倍定值(X)标准化(EQ。1.).

Y = μ ρ
(1)

当X = ln(X)时,μ:每次治疗中所有X值(来自所有探针)的平均值,ρ:每次治疗中所有X值(来自所有探针)的标准差。使用以下选项运行ClusterMaker v.1.11:“成对平均-连锁”为连锁,“皮尔逊相关”为距离度量。选项“所有的阵列源”(日志规模的微阵列数据)与选择“集群属性以及节点”和“忽略节点/边缘没有数据”。

不同植物类群保护水平的比较

首先,利用MAFFT对Task3中的每棵树进行多序列比对(MSA),建立一致序列[42.].这些共识序列用作psi-blast的噬菌体蛋白质蛋白蛋白酶(参见上文)和一组额外的AM主管单粒子。通过对E值的Wilcoxon试验确定(am-promistent Dicots),B组(am-promitent dicots),B(竞争单焦点)和c(非菌根单焦点)和c(非菌根单焦点)之间的氨基酸序列保守水平的显着差异(导致附加文件中的p值12:表S4和附加文件13:表S5)。

为了计算保护比,将E值平均在A组(AM-Promistent Dicots:MTR,GMA,SLY,STU,VVI,PTR)之间进行平均;B组(AM-竞争单码:OSA,ZMA,TUR,SBI,HVU,BDI和ATA);和c组(非菌根Dicots:Ath,Aly,Bra)。随后,计算平均e-值的比率以确定A,B和C组之间任务3(AM相关基因)和任务9(Houskeging Genes)鉴定的蛋白质的相对相关性(附加文件14:表S6,图6.7.).

启动子元件分析

为寻找启动子中潜在的调控元件,对所有预测启动子的2kb上游序列m . truncatula从Enerembl Problent Biomart下载(http://plants.ensembl.org/biomart/martview). 预测潜在的监管风险独联体与AM相关的-作用元件,由Task4鉴定并在AM和/或丛枝皮层细胞中诱导至少3倍的基因启动子(n = 190),采用模式识别软件MEME (http://meme.nbcr.net/meme/doc/cite.html) [85].在第一种方法中,将搜索设置为长度为6-30 nt的序列,执行第二次搜索以识别优先回文序列。

评估预测的独联体- am相关基因的启动子中的元素,myc1和myc2元素(图9)以及GCCGGC元素和CTTC/MYCS元素[46.],[47.)的发起人中寻找m . truncatula在菌根根和/或激光显微切割的丛枝细胞中(n = 190), Task4的启动子被诱导>3倍m . truncatula(46014)使用Jemboss“Nucleic Motif Fuzznuc”[86].相对于基于随机序列的期望频率,分别的样本中预测元素的过度代表通过二项式检验,与Fisher值= 0.05相比,系数水平为95%(附加文件16:表S7)。由Task4识别的启动子(Task4/all)和am诱导的启动子(AMup/all)相对于所有启动子的Fold overrepresentation计算为相对频率的比值(% rel. freq.)。

提供支持数据的可用性

微阵列数据可用截形苜蓿基因表达图谱(MtGEA version 3;http://mtgea.noble.org/v3).植物蛋白质组从植物集成网站(www.ensemblgenomes.org; 数据库版本20)。基因启动子序列m . truncatula从Enerembl Problent Biomart下载(http://plants.ensembl.org/biomart/martview).利用在线工具编制系统发育树www.phylogny.fr.使用标准模式(“一键式”)和附加文件中提供的序列1.:文件S1。所有支持资料已存入实验室档案(http://www.labarchives.com).

请注意证明

自本手稿提交以来,一个可比较的基因发现工作流程已经公布[87]. 本文探讨了植物共生相关基因的进化。我们提供了一个比较列表(附加文件20:表S9)从DELAUX等人中记录了预测的共生相关核基因的重叠。从我们的研究中。

其他文件

参考文献

  1. 1.

    Smith SE, Read DJ:菌根共生。第三版。学术,纽约,2008。

    谷歌学者

  2. 2.

    王斌,邱玉林:陆地植物菌根的系统发育分布与进化。菌根。2006,16(5):299-363.10.1007/s00572-005-0033-6。

    文章中科院PubMed.谷歌学者

  3. 3.

    陆生植物根系和菌根的共同进化。新植物醇。2002年,154(2):275-304.10.1046/j.1469-8137.2002.00397.x。

    文章谷歌学者

  4. 4.

    Gutjahr C,Parniske M:丛枝菌根共生的细胞和发育生物学。细胞生物学年度回顾。2013年,29:593-617.10.1146/annurev-cellbio-101512-122413。

    文章中科院PubMed.谷歌学者

  5. 5。

    Delaux PM、Sejalon Delmas N、Bécard G、AnéJM:植物-微生物共生“工具箱”的进化。植物科学趋势。2013,18(6):298-304.10.1016/j.tplants.2013.01.008。

    文章中科院PubMed.谷歌学者

  6. 6.

    Wang B, Yeun LH, Xue JY, Liu Y, Ane JM, Qiu YL:在陆地植物的共同祖先中存在3个菌根基因,表明菌根在植物对陆地的定殖中起着关键作用。植物营养与肥料学报,2010,31(2):529 - 533。10.1111 / j.1469-8137.2009.03137.x。

    文章PubMed.谷歌学者

  7. 7.

    Redecker D,Kodner R,Graham LE:奥陶纪的格洛马真菌。科学。2000,289(5486):1920-1921。10.1126/science.289.5486.1920。

    文章中科院PubMed.谷歌学者

  8. 8.

    Kistner C,Parniske M:细胞内共生中信号转导的进化。植物科学趋势。2002,7(11):511-518.10.1016/S1360-1385(02)02356-7。

    文章中科院PubMed.谷歌学者

  9. 9

    Sprent JI, James EK:豆科进化:根瘤和菌根在哪里?植物生理学报,2007,44(2):523 - 531。10.1104 / pp.107.096156。

    公共医学中心文章中科院PubMed.谷歌学者

  10. 10.

    短纪:60 Ma豆科结瘤。有什么新鲜事吗?改变是什么?。实验机器人,2008,59(5):1081-1084。10.1093 / jxb / erm286。

    文章中科院PubMed.谷歌学者

  11. 11

    Hocher V、Alloisio N、Auguy F、Fournier P、Doumas P、Pujic P、Gherbi H、Queiroux C、Da Silva C、Wincker P、Normand P、Bogusz D:放射根共生体的转录组学揭示了整个共同共生信号级联的同源物。植物生理学。2011,156(2):700-711.10.1104/pp.111.174151。

    公共医学中心文章中科院PubMed.谷歌学者

  12. 12

    Svistonooff S、Benabdoun FM、Nambiar Veetil M、Imanishi L、Vaissayre V、Cesari S、Diagne N、Hocher V、de Billy F、Bonneau J、Wall L、Ykhlef N、Rosenberg C、Bogusz D、Franche C、Gherbi H:在fabids中独立获得植物根系固氮共生体为根瘤器官发生招募了相同的遗传途径。公共科学图书馆一号。2013,8(5):e64515-10.1371/journal.pone.0064515。doi:10.1371/journal.pone.0064515

    公共医学中心文章中科院PubMed.谷歌学者

  13. 13

    Oldroyd Ged:讲话,朋友,并输入:促进植物中有益的共生协会的信令系统。NAT Rev Microbiol。2013,11(4):252-263。10.1038 / nrmicro2990。

    文章中科院PubMed.谷歌学者

  14. 14。

    Oldroyd GED, Downie JA:共生信号核心的核钙变化。中国生物医学工程学报,2006,22(4):457 - 461。10.1016 / j.pbi.2006.05.003。

    文章中科院PubMed.谷歌学者

  15. 15.

    Singh S,Parniske M:激活钙和钙调素依赖性蛋白激酶(CCaMK),植物根系内共生的中央调节器。植物生物学。2012年,15(4):444-453.10.1016/j.pbi.2012.04.002。

    文章中科院PubMed.谷歌学者

  16. 16

    Feddermann N, Duvvuru Muni r, Zeier T, Stuurman J, Ercolin F, Schorderet M, Reinhardt D: ThePAM1.培养的植物基因,内部容纳和丛枝菌根真菌的形态发生,编码了Vapyrin的同源物。工厂J.2010,64(3):470-481。10.1111 / J.1365-313x.2010.04341.x。

    文章中科院PubMed.谷歌学者

  17. 17

    Pumplin N、Mondo SJ、Topp S、Starker CG、Gantt JS、Harrison MJ:截形苜蓿Vapyrin是一种丛枝菌根共生所需的新型蛋白。植物学报,2010,61(3):482-494。10.1111 / j.1365 - 313 x.2009.04072.x。

    文章中科院PubMed.谷歌学者

  18. 18

    Feddermann N, Reinhardt D: VAPYRIN ankyrin结构域的保守残基表明了潜在的蛋白-蛋白相互作用表面。植物信号转导行为研究[j] ., 2011, 6(5): 680-684。10.4161 / psb.6.5.14972。

    文章中科院谷歌学者

  19. 19

    Breuillin F、Schramm J、Hajirezaei M、Ahkami A、Favre P、Druege U、Hause B、Bucher M、Kretzschmar T、Bossolini E、Kuhlemeier C、Martinoia E、Franken P、Scholz U、Reinhardt D:磷酸盐系统地抑制矮牵牛丛枝菌根的发育,并抑制菌根功能相关基因。植物学报,2010,64:1002-1017。10.1111 / j.1365 - 313 x.2010.04385.x。

    文章中科院PubMed.谷歌学者

  20. 20

    Rich MK,Schorderet M,Reinhardt D:细胞壁室在植物共生中的作用。前植物科学。2014,5:238-10.3389/fpls.2014.00238。

    公共医学中心文章PubMed.谷歌学者

  21. 21

    Gobbato E、Marsh JF、Vernie T、Wang E、Maillet F、Kim J、Miller JB、Sun J、Bano SA、Ratet P、Mysore KS、DénariéJ、Schultze M、Oldroyd GE:一种在菌根信号传导中具有特定功能的GRAS型转录因子。电流生物学。2012,22(23):2236-2241.10.1016/j.cub.2012.09.044。

    文章中科院PubMed.谷歌学者

  22. 22.

    哈里森·MJ: 2个截形苜蓿半衰期运输扣对丛枝菌根共生中的仲裁发育至关重要。植物细胞。2010,22(5):1483-1497。10.1105 / TPC.110.074955。

    公共医学中心文章中科院PubMed.谷歌学者

  23. 23.

    刘建英:磷酸转运体的研究进展截形苜蓿参与获得丛枝菌根真菌释放的磷酸盐。植物细胞学报,2002,14(10):2413-2429。10.1105 / tpc.004861。

    公共医学中心文章中科院PubMed.谷歌学者

  24. 24.

    Javot H,Penmetsa RV,太沙基N,库克博士,哈里森MJ:A截形苜蓿磷酸铁酯对于丛枝菌根共生不可或缺。Proc Natl Acad Sci U S A. 2007,104(5):1720-1725。10.1073 / PNAS.0608136104。

    公共医学中心文章中科院PubMed.谷歌学者

  25. 25.

    施瑞伯F, Sonnhammer ELL: Hieranoid: Hierarchical Orthology Inference。中国生物医学工程学报,2013,25(11):2072-2081。10.1016 / j.jmb.2013.02.018。

    文章中科院PubMed.谷歌学者

  26. 26.

    Murray JD、Duvvuru Muni R、Torres Herez I、Tang Y、Allen S、Andriankaja M、Li G、Laxmi A、Cheng X、Wen J、Vaughan D、Schultze M、Sun J、Charpentier M、Oldroyd G、Tadege M、Ratet P、Mysore KS、Chen R、Udvardi MK:Vapyrin,一种对丛枝菌根共生的细胞内进展至关重要的基因,对根尖的结节共生中的根瘤菌感染也是必不可少的截形苜蓿. 植物J。2011,65(2):244-252.10.1111/j.1365-313X.2010.04415.x。

    文章中科院PubMed.谷歌学者

  27. 27.

    阿普韦勒R、贝特曼A、马丁MJ、奥多诺万C、马格拉内M、阿拉姆法鲁克Y、阿尔卑斯E、安图内斯R、阿甘尼斯卡J、卡萨诺瓦EB、贝里B、宾利M、博尼利亚C、布里托R、伯斯坦纳斯B、孟陈W、查瓦利G、西布莱恩乌哈尔特E、达席尔瓦A、德乔治M、法齐尼F、甘尼P、卡斯特罗LG、加米里P、哈顿埃利斯E、希塔R、亨特利R、莱格D、刘W、罗J,等:在通用蛋白质资源(UniProt)的活动。核酸研究,2014,42(D1):D191-D198。10.1093/nar/gkt1140。

    文章谷歌学者

  28. 28.

    Groth M,Takeda N,Perry J,Uchida H,Draexl S,Brachmann A,Sato S,Tabata S,Kawaguchi M,Wang TL,Parniske M:NENA,SEC13的莲花japonicus homolog,是丛生菌疹的根瘤菌感染所必需的真菌和根瘤菌,但可随时用于皮质内肌肤发育。植物细胞。2010年,22:2509-2526。10.1105 / TPC.109.069807。

    公共医学中心文章中科院PubMed.谷歌学者

  29. 29。

    Kanamori N、Madsen LH、Radutoiu S、Frantescu M、quistgard EMH、Miwa H、Downie JA、James EK、Felle HH、Haaning LL、Jensen TH、Sato S、Nakamura Y、Tabata S、Sandal N、Stougaard J:核孔蛋白是豆科植物根瘤发育中诱导Ca2+尖峰所必需的,也是根瘤菌和真菌共生所必需的。美国国家科学院学报。2006年,103(2):359-364.10.1073/pnas.0508883103。

    公共医学中心文章中科院PubMed.谷歌学者

  30. 30

    齐藤K, Yoshikawa M,矢野K,古板的H,田H, Asamizu E,佐藤年代,Tabata年代,Imaizumi-Anraku H, Umehara Y, Kouchi H, Murooka Y, Szczyglowski K, JA, Parniske M, Hayashi M,川口M: NUCLEOPORIN85需要钙激增,真菌和细菌的共生,在Lotus对虾和种子生产。植物细胞学报,2007,19(2):610-624。10.1105 / tpc.106.046938。

    公共医学中心文章中科院PubMed.谷歌学者

  31. 31

    Fiorilli V,Catoni M,Miozzi L,Novero M,Accotto GP,Lanfranco L:由丛林菌根真菌的番茄植物中的全局和细胞型基因表达谱。新植物。2009,184(4):975-987。10.1111 / J.1469-8137.2009.03031.x。

    文章中科院PubMed.谷歌学者

  32. 32.

    关键词:丛枝菌根,生物发生,调控网络,重编程,丛枝菌根莲藕. 新植物醇。2009年,182(1):200-212.10.1111/j.1469-8137.2008.02725.x。

    文章中科院PubMed.谷歌学者

  33. 33.

    Güimil S、Chang HS、Zhu T、Sesma A、Osbourn A、Roux C、Ionidis V、Oakeley EJ、Docquier M、Descombes P、Briggs SP、Paszkowski U:水稻的比较转录组学揭示了一种古老的微生物定殖反应模式。美国国家科学院学报。2005,102(22):8066-8070。10.1073/pnas.050299102。

    公共医学中心文章PubMed.谷歌学者

  34. 34.

    Hohnjec N,Vieweg ME,Puhler A,Becker A,Küster H:基因转录谱的重叠截形苜蓿根接种两种不同血管球真菌为丛枝菌根激活的遗传程序提供了见解。植物生理学杂志。2005,31(4):549 - 554。10.1104 / pp.104.056572。

    公共医学中心文章中科院PubMed.谷歌学者

  35. 35.

    Liu JY,Blaylock LA,Endre G,Cho J,Town CD,VandenBosch KA,Harrison MJ:转录谱与空间表达分析结合揭示了丛枝菌根共生不同发育阶段的相关基因。植物细胞。2003,15(9):2106-2123。10.1105/tpc.014183。

    公共医学中心文章中科院PubMed.谷歌学者

  36. 36

    Lévy J、Bres C、Geurts R、Chalhoub B、Kulikova O、Duc G、Journet EP、AnéJM、Lauber E、Bisseling T、DénariéJ、Rosenberg C、DebelléF:细菌和真菌共生体所需的钙离子和钙调素依赖性蛋白激酶。科学。2004,303(5662):1361-1364。10.1126/science.1093038。

    文章PubMed.谷歌学者

  37. 37

    一种Ca2+/钙调素依赖的蛋白激酶,是共生结节发育所必需的:通过转录基克隆进行基因鉴定。国家自然科学基金项目,2009.12 - 2009.12。10.1073 / pnas.0400595101。

    公共医学中心文章中科院PubMed.谷歌学者

  38. 38。

    Nagy F、Karandashov、Chague W、Kalinkevich K、Tamasloukht M、Xu GH、Jakobsen I、Levy AA、Amrhein N、Bucher M:来自番茄茄属植物tuberosum揭示茄科植物中共生磷酸盐转运的功能冗余。植物学报,2005,42(2):236-250。10.1111 / j.1365 - 313 x.2005.02364.x。

    文章中科院PubMed.谷歌学者

  39. 39。

    Rausch C,Daram P,Brunner S,Jansa J,Laloi M,Leggewie G,Amrhein N,Bucher M:一种在马铃薯含丛枝细胞中表达的磷酸转运蛋白。自然。2001, 414 (6862): 462-466. 10.1038/35106601.

    文章中科院PubMed.谷歌学者

  40. 40。

    Wegmüller S, Svistoonoff S, Reinhardt D, Stuurman J, Amrhein N, Bucher M:一种利用dTph1基因插入诱变菌根中磷酸盐转运正向遗传的系统。植物学报,2008,54(6):1115-1127。10.1111 / j.1365 - 313 x.2008.03474.x。

    文章PubMed.谷歌学者

  41. 41

    Guether M, Neuhauser B, Balestrini R, Dynowski M, Ludewig U, Bonfante P:一种菌根特异性氨转运体莲藕通过丛枝菌根真菌获得释放的氮。植物理性。2009,150(1):73-83。10.1104 / pp.109.136390。

    公共医学中心文章中科院PubMed.谷歌学者

  42. 42

    Katoh K,Standley DM:MAFFT多序列比对软件版本7:性能和可用性的改进。分子生物学。2013,30(4):772-780.10.1093/molbev/mst010。

    公共医学中心文章中科院PubMed.谷歌学者

  43. 43

    Shaikhali J, Noren L, Barajas-Lopez JD, Srivastava V, Konig J, Sauer UH, Wingsle G, Dietz KJ, Strand A:氧化还原介导的机制调节碱性区域亮氨酸拉链(bZIP)转录因子G基团的DNA结合活性拟南芥. 生物化学杂志。2012,287(33):27510-27525.10.1074/jbc.M112.361394。

    公共医学中心文章中科院PubMed.谷歌学者

  44. 44

    一种新型顺式作用元件,ESP,有助于燕麦球蛋白启动子的高水平胚乳特异性表达。中国生物医学工程学报,2006,24(1):1 - 5。10.1007 / s11103 - 006 - 9014 - 1。

    文章中科院PubMed.谷歌学者

  45. 45

    周P,Yang F,Yu JJ,Ao GM,Zhao问:几个顺式元素,包括参与SbGlr启动子的花粉特异性活动的回文。植物细胞代表2010,29(5):503-511。10.1007 / S00299-010-0839-3。

    文章中科院PubMed.谷歌学者

  46. 46.

    陈亚奇,顾玛,孙思波,朱LL,洪莎,徐国华:两个保守的顺式作用元件MYCS和P1BS的鉴定,它们参与了真双子叶植物菌根激活的磷酸转运蛋白的调控。新植物醇。2012,189(4):1157-1169.10.1111/j.1469-8137.2010.03556.x。

    文章谷歌学者

  47. 47.

    Lota F、Wegmüller S、Buer B、Sato S、Bräutigam A、Hanf B、Bucher M:顺式作用的CTTC-P1BS模块指示了LjVTI12的基因功能,LjVTI12是日本莲丛枝形成所需的Qb陷阱蛋白基因。植物J。2013,74(2):280-293.10.1111/tpj.12120。

    文章中科院PubMed.谷歌学者

  48. 48.

    Radutoiu S, Madsen LH, Madsen EB, Felle HH, Umehara Y, Gronlund M, Sato S, Nakamura Y, Tabata S, Sandal N, Stougaard J:植物识别共生细菌需要两个LysM受体样激酶。自然科学学报,2003,25(6):529 - 533。10.1038 / nature02039。

    文章中科院PubMed.谷歌学者

  49. 49.

    Markham Je,Lynch DV,Napier Ja,Dunn TM,加入EB:植物鞘脂:功能遵循形式。CurrOp植物BIOL。2013,16(3):350-357。10.1016 / J.PBI.2013.02.009。

    文章中科院PubMed.谷歌学者

  50. 50.

    Kutchan TM:生物碱生物合成基因的异源表达-综述。基因。1996,179(1):73-81.10.1016/S0378-1119(96)00426-X。

    文章中科院PubMed.谷歌学者

  51. 51.

    Govindarajulu M、Pfeffer PE、Jin HR、Abubaker J、Douds DD、Allen JW、Bücking H、Lammers PJ、Shachar Hill Y:丛枝菌根共生中的氮转移。自然。2005,435(7043):819-823.10.1038/nature03610。

    文章中科院PubMed.谷歌学者

  52. 52.

    田CJ,Kasiborski B,Koul R,Lammers PJ,BückingH,Shachar-Hill Y:丛生菌根共生中的氮转移途径的调节:基因表征和氮气通量的表达的协调。植物理性。2010,153(3):1175-1187。10.1104 / pp.110.156430。

    公共医学中心文章中科院PubMed.谷歌学者

  53. 53

    Miyawaki K,Tabata R,Sawa S:在植物发育,共生和寄生中的进化肽信号传导。CurrOp植物BIOL。2013,16(5):598-606。10.1016 / J.PBI.2013.08.008。

    文章中科院PubMed.谷歌学者

  54. 54

    Chen Cy,Zhu Hy:OSIPD3,Medicago truncatula DMI3相互作用蛋白IPD3的矫正蛋白IPD3是米中的髓中毒共生所必需的。新植物。2008,180(2):311-315。10.1111 / J.1469-8137.2008.02612.x。

    文章中科院PubMed.谷歌学者

  55. 55

    Horvath B、Yeun LH、Domonkos A、Halasz G、Gobbato E、Ayaydin F、Miro K、Hirsch S、Sun JH、Tadege M、Ratet P、Mysore KS、AnéJM、Oldroyd GE、KalóP:截形苜蓿IPD3是根瘤菌和菌根共生所必需的共同共生信号通路中的一员。植物与微生物的分子相互作用。2011,24(11):1345-1358。10.1094 / mpmi - 01 - 11 - 0015。

    文章中科院PubMed.谷歌学者

  56. 56.

    Yano K, Yoshida S, Muller J, Singh S, Banba M, Vickers K, Markmann K, White C, Schuller B, Sato S, Asamizu E, Tabata S, Murooka Y, Perry J, Wang TL, Kawaguchi M, Imaizumi-Anraku H, Hayashi M, Parniske M: CYCLOPS,一种共生胞内调节介质。中国科学(d辑),2008,40(5):549 - 554。10.1073 / pnas.0806858105。

    公共医学中心文章中科院PubMed.谷歌学者

  57. 57.

    Scheller HV, Ulvskov P:半纤维素。植物生态学报。2010,31(6):649 - 652。10.1146 / annurev - arplant - 042809 - 112315。

    文章中科院PubMed.谷歌学者

  58. 58.

    关键词:受体蛋白激酶,自交不亲和基因,分子克隆甘蓝.Proc Natl Acad Sci U S A. 1991,88(19):8816-8820。10.1073 / pnas.88.19.8816。

    公共医学中心文章中科院PubMed.谷歌学者

  59. 59.

    s位点受体激酶信号转导。生物化学学报,2014,42(4):549 - 554。10.1042 / BST20130222。

    文章中科院PubMed.谷歌学者

  60. 60.

    Walker JC,张R:来自玉米的推定受体蛋白激酶与S-Locus糖蛋白的关系芸苔.自然科学进展,1999,15(1):1 -7。10.1038 / 345743 a0。

    文章中科院PubMed.谷歌学者

  61. 61。

    Hernandez-Garcia CM, Finer JJ:启动子和顺式调控元件的鉴定和验证。植物保护学报,2014,34(5):559 - 564。10.1016 / j.plantsci.2013.12.007。

    文章PubMed.谷歌学者

  62. 62。

    拟南芥AP2/ERF转录因子RAP2.11调控植物对低钾胁迫的反应。Mol Plant, 2012, 5(5): 1042-1057。10.1093 / mp / sss003。

    文章中科院PubMed.谷歌学者

  63. 63。

    Ramkumar G、Madhav MS、Biswal AK、Rama Devi SJS、Sakthivel K、Mohan MK、Umakanth B、Mangrauthia SK、Sundaram RM、Viraktamath BC:水稻和水稻中NBS-LRR基因转录因子结合基序的全基因组鉴定和表征拟南芥. 基因组和外显子。2014, 3: 7-15.

    谷歌学者

  64. 64。

    Cheng Mc,Liao PM,Kuo WW,Lin TP:拟南芥乙烯应答因子1通过与不同的基因结合调控非生物胁迫应答基因的表达独联体-作用元件对不同的应力信号作出反应。植物生理学。2013,162(3):1566-1582。10.1104/pp.113.221911。

    公共医学中心文章中科院PubMed.谷歌学者

  65. 65

    Hao DY,Yamasaki K,Sarai A,Ohme Takagi M:两种植物转录因子CBF1和NtERF2与DRE和GCC基序序列特异性结合的决定因素。生物化学。2002,41(13):4202-4208.10.1021/bi015979v。

    文章中科院PubMed.谷歌学者

  66. 66

    胡凤英,王丹,赵晓琴,张涛,孙红霞,朱丽华,张飞,李丽娟,李启高,陶大勇,付斌,李忠:基于全基因组差异表达分析的根状茎特异性基因鉴定oryza longistaminata.. BMC植物生物学。2011, 11: 18-10.1186/1471-2229-11-18.

    公共医学中心文章中科院PubMed.谷歌学者

  67. 67

    吕×,蒋维民,张莉,张福,张飞,沈Q,王广发,唐KX:AaERF1对青蒿灰霉病抗性有正向调节作用。公共科学图书馆一号。2013,8(2):e57657-10.1371/journal.pone.0057657。doi:10.1371/journal.pone.0057657

    公共医学中心文章中科院PubMed.谷歌学者

  68. 68

    Pirrello J、Prasad BCN、Zhang WS、Chen KS、Mila I、Zouine M、Latch A、Pech JC、Ohme Takagi M、Regad F、Bouzayen M:番茄乙烯反应因子的功能分析和结合亲和力提供了植物对乙烯差异反应的分子基础。BMC植物生物学。2012, 12: 190-10.1186/1471-2229-12-190.

    公共医学中心文章中科院PubMed.谷歌学者

  69. 69

    研究乙烯反应因子转录因子在植物防御中的作用。植物生理学报,2013,42(2):457 - 461。10.1104 / pp.113.217455。

    公共医学中心文章中科院PubMed.谷歌学者

  70. 70

    关键词:番茄,细菌性斑点病,Pto激酶中国生物医学工程学报,1997,16(11):3207-3218。10.1093 / emboj / 16.11.3207。

    公共医学中心文章中科院PubMed.谷歌学者

  71. 71

    弗兰肯P,GNädingerf:荷兰芹枝氨症分析 - 无解相关基因的感染,发育和信使 - RNA水平。Mol植物微生物相互作用。1994,7(5):612-620。10.1094 / mpmi-7-0612。

    文章中科院谷歌学者

  72. 72

    Gallou A,Declerck S,Cranenbrouck S:防御基因的转录调控和WRKY转录因子在丛枝菌根马铃薯根定殖中的参与。函数整数。2012,12(1):183-198.10.1007/s10142-011-0241-4。

    文章中科院谷歌学者

  73. 73.

    Wulf A,Manthey K,Doll J,Perlick AM,Linke B,Bekel T,Meyer F,Franken P,Kuster H,Krajinski F:模式植物苜蓿丛枝菌根发育的转录变化。植物与微生物相互作用。2003,16(4):306-314.10.1094/MPMI.2003.16.4.306。

    文章中科院PubMed.谷歌学者

  74. 74.

    Fukai E, Soyano T, Umehara Y, Nakayama S, Hirakawa H, Tabata S, Sato S, Hayashi M:利用外显子靶向内源反转录转座子LORE1建立荷花基因标记群体。植物学报,2012,69(4):720-730。10.1111 / j.1365 - 313 x.2011.04826.x。

    文章中科院PubMed.谷歌学者

  75. 75.

    TASEGE M,Ratet P,Mysore Ks:插入诱变:Medicago Truncatula功能基因组学的瑞士军刀。趋势植物SCI。2005,10(5):229-235。10.1016 / J.Plants.2005.03.009。

    文章中科院PubMed.谷歌学者

  76. 76.

    Vandenbussche M、Janssen A、Zethof J、van Orsouw N、Peters J、van Eijk MJT、Rijpkema AS、Schneiders H、Santhanam P、de Be M、van Tunen A、Gerats T:三维索引的生成牵牛花反向遗传学插入数据库。植物J。2008年,54(6):1105-1114.10.1111/j.1365-313X.2008.03482.x。

    文章中科院PubMed.谷歌学者

  77. 77

    Dereeper A, Guignon V, Blanc G, Audic S, Buffet S, Chevenet F, Dufayard JF, Guindon S, Lefort V, Lescot M, Claverie JM, Gascuel O:系统发育分析。微生物学通报,2008,29(3):426 - 426。10.1093 / nar / gkn180。

    公共医学中心文章中科院PubMed.谷歌学者

  78. 78

    Anisimova M,Gascuel O:分支的近似似然比检验:一种快速、准确、有效的替代方法。系统生物学。2006, 55 (4): 539-552. 10.1080/10635150600755453.

    文章PubMed.谷歌学者

  79. 79

    Kersey PJ,Staines DM,Lawson D,Kulesha E,Derwent P,Humphrey JC,Hughes DST,Keenan S,Kerhornou A,Koscielny G,Langridge N,McDowall MD,Megy K,Maheswari U,Nuhn M,Paulini M,Pedro H,Toneva I,Wilson D,Yates A,Birney E:Ensembl基因组:非脊椎动物物种基因组规模数据的整合资源。核酸研究,2012,40(D1):D91-D97。10.1093/nar/gkr895。

    公共医学中心文章中科院PubMed.谷歌学者

  80. 80

    Junier T,Zdobnov EM:Newick实用程序:unixshell中的高通量系统树处理。生物信息学。2010,26(13):1669-1670.10.1093/bioinformatics/btq243。

    公共医学中心文章中科院PubMed.谷歌学者

  81. 81

    Benedito VA, Torres-Jerez我穆雷JD Andriankaja,艾伦,卡卡尔K, Wandrey M, Verdier J, Zuber H,奥特T,莫罗年代Niebel A, Frickey T, weil G,他J,戴X,赵P,唐Y, Udvardi M,莫罗年代Niebel A, Frickey T, weil G,他J,戴X,赵P,唐Y, Udvardi M:豆类的基因表达图谱模型截形苜蓿. 植物J。2008年,55(3):504-513.10.1111/j.1365-313X.2008.03519.x。

    文章中科院PubMed.谷歌学者

  82. 82.

    何杰、贝内迪托·瓦、王美、穆雷·JD、赵·PX、唐·YH、乌德瓦迪·MK:The截形苜蓿基因表达图谱网络服务器。生物信息学。2009, 10: 441-10.1186/1471-2105-10-441.

    公共医学中心文章PubMed.谷歌学者

  83. 83.

    smot ME, Ono K, Ruscheinski J, Wang PL, Ideker T: Cytoscape 2.8:数据集成和网络可视化的新特性。生物信息学。2011,27(3):431-432。10.1093 /生物信息学/ btq675。

    公共医学中心文章中科院PubMed.谷歌学者

  84. 84.

    Morris JH,Apeltsin L,Newman AM,Baumbach J,Wittkop T,Su G,Bader GD,Ferrin TE:clusterMaker:一个用于Cytoscape的多算法聚类插件。生物信息学。2011, 12: 436-10.1186/1471-2105-12-436.

    公共医学中心文章中科院PubMed.谷歌学者

  85. 85。

    Bailey TL,Boden M,Buske Fa,Frith M,Grant Ce,Clementi L,Ren Jy,Li WW,Noble Ws:Meme Suite:用于主题发现和搜索的工具。核酸RES。2009,37:W202-W208。10.1093 / nar / gkp335。

    公共医学中心文章中科院PubMed.谷歌学者

  86. 86。

    Rice P,Longden I,Blaesby A:浮雕:欧洲分子生物学开放软件套件。趋势Genet。2000,16(6):276-277.10.1016/S0168-9525(00)02024-2。

    文章中科院PubMed.谷歌学者

  87. 87。

    Delaux PM,Varala K,Edger PP,Coruzzi GM,Pires JC,AnéJM:比较系统基因组学揭示了共生关系对宿主基因组进化的影响。公共科学图书馆Genet。2014,10(7):e1004487-10.1371/journal.pgen.1004487。

    公共医学中心文章PubMed.谷歌学者

下载参考

确认

计算是在关键时刻进行的(http://www.vital-it.ch.)瑞士生物信息学研究所(SIB)高性能计算中心。我们要感谢梅兰妮K。非常有帮助的讨论。

作者信息

从属关系

作者

相应的作者

通信迪迪埃·莱因哈特

附加信息

相互竞争的利益

作者声明他们没有相互竞争的利益。

作者的贡献

PF参与了生物信息学策略的设计,进行了数据库管理和大部分生物信息学分析,并起草了手稿。LB参与了策略设计、启动子分析和手稿构思。EB参与了本研究的设计,并进行了大规模的蛋白质组培养。MD参与了研究的协调并进行了统计。LF构想了生物信息学策略并协调了大规模计算工作。博士是参与设计策略、构思手稿和协调项目的主要研究者。所有作者都阅读并批准了最后的手稿。

电子辅助材料

12870 _2014_333_moesm1_esm.docx

附加文件1:文件S1。:Protein sequences used for phylogenetic analysis of RAM1, PT4, RPL5, cyclinD6 (Figure1.),α-葡萄糖苷酶/木糖酶(图8.),和SRK同系物(附加文件11:图S5)。(docx 221 kb)

12870\ 2014\ 333\ MOESM2\ ESM.png

附加文件2:图S1.:用于Hieranoid聚类的植物物种的概念系统发育树。这种定性的系统发育树被用于蛋白质序列的成对比较,以逐步的方式构建蛋白质簇。节点之间的距离与此过程无关,随机设置为4。(PNG 183 KB)

12870 _2014_333_moesm3_esm.zip

附加文件3:文件S2。:Collection of procedures and scripts shown in Figure2.. 程序的Zip文件(P0和P3)、脚本(P1和P4)和Cytoscape文件(P2)如图所示2.和方法。下面的脚本(blastcheck.sh, compilMSA.sh, compilMSAinfo.sh, OGT2MSA.pl和task.lua)和数据(all9。tre和MappingsMtrAffy.csv)是正确执行脚本所必需的。(ZIP 4 MB)

12870_2014_333_moesm4_esm.txt.

附加文件4:文件S3.:来自Hieranoid集群的源文件。包含用于使用Task3到Task9进行过滤的所有28'528树的同源/旁同源蛋白质树的信息的文本文件(TXT(9 MB)

12870\ 2014\ 333\ MOESM5\ ESM.xlsx

附加文件5:表S1.:对照蛋白质作为过滤策略的参考。用Task4、Task5和Task6对已知功能的蛋白质进行过滤,以检测过滤程序是否能区分AM相关蛋白和管家蛋白。AM相关蛋白被三种滤过物所保留(≤6) ,任务4和任务5(≤5) ,或仅通过任务4(≤4). 排除蛋白质是因为它们在非菌根物种中有同源物,如A. Thaliana.(分类为“No”),或者因为在不到4个am敏感物种中发现了同源物(分类为“No”)。见附加文件6.:所引用的参考文献文件为S4。(XLSX 79 KB)

12870 _2014_333_moesm6_esm.docx

附加文件6:文件S4:附加文件引用的参考文献5.S1:表。多克斯(139 KB)

12870 _2014_333_moesm7_esm.xlsx

附加文件7:表S2.:通过编码序列的AM相关保守性鉴定的基因的表达分析根据标准1-6测试Task4的基因列表的表达(见表2.). 对于AM诱导的基因(标准2),诱导率在表达结果与对照组之间取平均值R不规则(称为G根内在Affymetrix数组上),以及G. Mosseae..根据准则2的归纳比递减排序。(XLSX 163 KB)

12870 _2014_333_moesm8_esm.xls

附加文件8:表S3.:根据标准1-6对基因表达进行组合分析得出的基因列表(与附加文件进行比较)8.:表S3和图3.).列表a:仅在菌根中诱导的基因。列表b:菌根根和丛枝微解剖根中诱导的基因。列表c:微解剖根与丛枝的特异诱导基因。(XLS 54 KB)

12870 _2014_333_moesm9_esm.eps

附加文件9:图S2:通过基于全局基因表达模式的聚类确定的AM诱导基因。利用MtGEA中的整个数据集,包括所有探针集的所有254个处理,根据基因表达模式进行分层基因聚类。该簇是基于其在菌根中的高诱导基因表达而选择的(标准2)。如果值高于平均量表得分,则每个基因(y轴)的不同处理(x轴)对应的值以红色显示,如果值低于平均量表得分,则以绿色显示(每股收益(1 MB)

12870 _2014_333_moesm10_esm.eps

附加文件10:图S3:通过基于全局基因表达模式的聚类确定AM-和结节诱导基因。利用MtGEA中的整个数据集,包括所有探针集的所有254个处理,根据基因表达模式进行分层基因聚类。根据菌根(标准2)和根瘤中基因表达的高诱导率选择簇。如果值高于平均量表得分,则每个基因(y轴)的不同处理(x轴)对应的值以红色显示,如果值低于平均量表得分,则以绿色显示(每股收益(166 KB)

12870\ 2014\ 333\ MOESM11\ ESM.png

附加文件11:图S5。:Phylogenetic tree of receptor-like protein kinases of diverse plant species. An unrooted phylogenetic tree was generated with the threem . truncatula序列标识在附加文件14:表S6b (Task3_238, Task3_354, Task3_4055;(见箭头),以及不同植物中最近的同源物。玉米凝集素类蛋白激酶ZmPK1;星号)包括供参考。(PNG 1 MB)

12870\ 2014\ 333\ MOESM12\ ESM.xlsx

附加文件12:表S4。:List of AM-related genes resulting from Task3. MSA consensus sequences were computed from Task3 protein clusters and used as queries for psiblast against the proteomes of the indicated species. P-values of <0.05 (Wilcoxon-test) indicate significantly different E-values between the groups as indicated. (XLSX 2 MB)

12870\ 2014\ 333\ MOESM13\ ESM.xls

附加文件13:表S5.:任务9产生的管家基因列表。附加文件中的基因列表12:表S4,但由Task9(管家基因)鉴定的蛋白质。(XLS 4 MB)

12870_2014_333_moesm14_esm.xls.

附加文件14:表S6.:具有AM相关序列保守性模式的蛋白质(a) 从附加文件合并的基因列表12:表S4(AM相关基因)和附加文件中的150个基因13:表S5(持家基因)。将每种植物(A、B、C) e值的log(10)取平均值,将C/A和C/B分开计算保护比值。为了计算管家基因的可靠保存比例,只从附加文件中选择了蛋白质13:表S5中e值大于零,且不同植物种类中不超过一个缺失的成员。管家基因以黄色突出显示,以揭示保护的范围,以上保护偏重于am能力物种。索引TASK3_xxx和TASK9_xxx对应于“附加文件”中的索引12:表S4和附加文件13分别为:S5。不同物种的蛋白质注释是通过使用蛋白质组中第一个可能的命中率获得的,优先顺序如下:M截肢,S。番茄属。块茎,O。萨蒂瓦,A。莱拉塔,A。拟南芥。陶氏,B。迪斯塔奇翁,B。拉帕,C。莱因哈德蒂,G。最大值,H。粗俗,P。专利,P。毛果属。双色,S。moellendorfii,T。乌拉尔图,Z。五月,和v葡萄.标记为绿色的蛋白质代表具有高am与amb相关的保护模式的成员,如附加文件所示14:表S6b(b) 从附加文件中提取14:表S6A,蛋白质,蛋白质,兼职的双胞胎和单子叶,相对于非菌根物种。(XLS 658 KB)

12870\ 2014\ 333\ MOESM15\ ESM.png

附加文件15:图S4.:潜在独联体-190个AM诱导启动子的调控元件预测。模因预测了6-30nt(a)之间的任何一个元素和6-30nt(b)之间的回文元素的潜在调控因子。序列后面的数字代表分析的190个启动子中出现的数目,以及模因提供的E值。蓝线连接了两次搜索的相关序列;黑线强调了相关预测之间的共同序列元素(PNG(1 MB)

12870 _2014_333_moesm16_esm.xlsx

附加文件16:表S7。:Statistical analysis of the frequency of predicted独联体-不同基因群启动子中的作用元件。模因预测的保守调控元件独联体-elements (Myc1和Myc2 element,以及GCCGGC)和CTTC element对由Task4鉴定的基因和AM诱导的基因(AM up)的启动子进行攻击。将预测的启动子元件对所有的启动子序列进行爆破,作为参考m . truncatula基因。总计:发起人人数(n);点击:与元素促发者的数量;p值:二项检验结果;调整假定值:假定值* n;Rel.频率:点击/总。(XLSX 182 KB)

12870 _2014_333_moesm17_esm.pdf

附加文件17:文件S5:AM诱导启动子回文调控元件模因分析结果(与数字比较9和额外的文件15:图S4)(PDF(2 MB)

12870\ 2014\ 333\ MOESM18\ ESM.png

附加文件18:图S6:保护S_RLK同源物的C丰地区。C-Rich地区的对齐甘蓝S_RLK6 (BoSRK6), ZmPK1,以及三个m . truncatula本研究中鉴定的蛋白质(MT238,MT354和MT4055)。(PNG 358 KB)

12870\ 2014\ 333\ MOESM19\ ESM.xls

附加文件19:表S8。:全部概述截形苜蓿蛋白对应基因在非菌根物种和am感受态物种之间存在显著差异。包括lsm解剖皮质细胞与丛枝(LCM)的基因诱导,以及nonAM和AM-competent dicots的e值(p-value Bra/Dic)比较的p值。对于不同的预测独联体-Elements,列出了各个启动子的命中数量。(XLS 346 KB)

12870\ 2014\ 333\ MOESM20\ ESM.xlsx

附加文件20:表S9:与Delaux等人(2014)保守基因列表的比较[87]. 174个保守AM相关基因的列表(附加文件20:Delaux等人2014年的表S9[87])与附加文件中列出的AM相关蛋白列表进行了比较19:表S8(见附注)。在两个列表中都发现了50个常见的基因。级别编号指的是附加文件中的级别7.S2:表。(XLSX 17 KB)

作者的原始提交的图像文件

权利和权限

开放存取本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。

本文中的图像或其他第三方材料包含在文章的知识共享许可证中,除非在材料的信用额度中另有说明。如果材料未包含在文章的知识共享许可证中,并且您的预期用途不受法律法规的允许或超出允许的用途,您将需要直接获得版权持有人的许可。

如欲浏览本许可证的副本,请浏览https://creativecommons.org/licenses/by/4.0/

知识共享公共领域放弃(https://creativecommons.org/publicdomain/zero/1.0/)适用于本条提供的数据,除非信用额度中另有规定。

再版和权限

关于这篇文章

通过交叉标记验证货币和真实性

引用这篇文章

Favre,P.,Bapaume,L.,Bossolini,E。et al。一种新型生物信息学管道,探索基于高等植物进化保护模式的丛生菌根共生相关的基因。BMC植物BIOL.14,333 (2014). https://doi.org/10.1186/s12870-014-0333-0

下载引用

关键字

  • 丛枝菌根
  • 共生
  • 共生信号
  • 共同SYM基因
  • 保护
  • 基因聚类
  • 蛋白质组分析
  • 生物信息学