跳到主要内容

利用基因表达信息和共表达网络注释柑橘基因功能

摘要

背景

柑橘类包括世界上最重要的经济水果作物,如甜橙、柑橘、柠檬和葡萄柚等主要栽培植物。随着这些物种的转录组数据量的增加,基因共表达网络(GCN)分析是在全基因组范围内预测基因功能的可行选择。GCN分析基于“关联有罪”原理,即基因编码参与相似和/或相关生物过程的蛋白质,在不同的实验条件下可能表现出相似的表达模式。而生物信息学资源,如GCN分析,可广泛用于模式植物物种的有效基因功能预测,包括拟南芥,大豆和水稻,柑橘这些工具还没有开发出来。

结果

我们从297个公开可用的Affymetrix genchip柑橘基因组微阵列数据集推断出了一个全面的柑橘GCN,提供了全基因组范围(33000个转录本)的基因共表达关系。综合柑橘GCN包括一个全球GCN(条件独立)和四个条件依赖GCN,仅调查甜橙物种、所有柑橘果实组织、所有柑橘叶片组织或胁迫暴露植物。所有这些GCNs都使用全基因组、基因中心(指南)和图聚类算法进行聚类,以实现基因功能预测的灵活性。对于每个假定的聚类,进行基因本体(GO)富集和基因表达特异性分析,以增强基因功能、表达和调控模式预测。引导基因方法用于推断参与疾病易感和维生素C代谢的基因的新作用,图聚类方法用于研究柑橘果皮中的类异戊二烯/苯丙烷代谢,以及柑橘果实中通过GABA分流的柠檬酸分解代谢。

结论

柑橘基因共表达网络、功能富集分析和基因表达信息的整合为推断柑橘基因功能提供了机会。我们提出了一个公众可访问的工具,柑橘共表达网络推理(NICCE,http://citrus.adelaide.edu.au/nicce/home.aspx),用于柑橘基因共表达分析。

背景

柑橘类芸香科植物中含有一些世界上最重要的经济水果作物。主要培养柑橘类植物包括c . sinensis(甜橙),c .试(普通话),c .利(柠檬)和c .天堂金花蛇(葡萄柚)。柑橘类2011年,全球水果产量为1.31亿吨,收获面积超过870万公顷(粮农组织统计数据,2013年),主要用于果汁制作和新鲜水果消费。柑橘类水果含有多种对促进健康很重要的营养成分,如单糖、膳食纤维、维生素(维生素B和C)、矿物质(钙、镁和钾)和生物活性植物化学物质(类胡萝卜素、类黄酮和类柠檬素)[1].这些化合物在植物中的代谢途径是众所周知的,但在柑橘类水果中负责编码这些途径蛋白质的基因在很大程度上仍未确定。

通过植物基因组测序来揭示它们的基因,并应用高通量表达技术(如DNA微阵列和RNA测序)来分析这些基因,已经产生了大量的基因信息数据集和基因组尺度的转录组数据,促进了我们对许多生物过程的理解。最近,甜橙的基因组草图显示,该物种是高度杂合的,在44387个预测转录本中,有29445个预测的蛋白质编码基因。其中,共有23804个蛋白质编码基因被分为14348个基因家族,而其余的则被注释为“假设的”或“功能未知的”蛋白质[2].全面的转录组测序还揭示了支持柑橘果实生物学重要关键性状的分子机制,如维生素C代谢、果实成熟的调节和抗病基因的鉴定[2].综上所述,这些信息为了解柑橘植物分子与病原体的相互作用、非生物胁迫耐受性以及重要经济和农艺性状的改善提供了宝贵的资源。然而,尽管最近在甜橙基因组测序方面做出了努力,但基因组中编码的大多数基因仍未被描述,而其他柑橘基因组的测序工作仍在进行中[3.].

基因共表达分析(GCA)是一种很有前途的方法,可以提高我们对这些基因如何在甜橙和相关柑橘植物中发挥作用的理解。来自植物DNA微阵列的公开的全基因组基因表达数据的积累已被证明是有用的,可以使用皮尔逊相关系数等成对相似度量来定义基因之间的相关表达模式。r,以及随后基因共表达网络(GCN)的基因组规模重建[45].基因通常被表示为“节点”,而连接单个节点的线或“边”表示节点之间的成对关系。密集连接的节点集合代表一个“集群”,节点、边和集群的整个集合形成共同表达的“网络”。通常,聚类内的共表达基因与具有相似表达模式的基因在功能上相关。这种“关联内疚”方法已经成为转录调控推断和理解植物内部和植物之间转录表达进化的有力工具[67].尽管“条件无关”GCA是植物GCA中的常见做法,它整合了所有可用的表达数据,而不考虑组织来源或实验程序,但几个“条件依赖”GCA的例子也已成功用于推断与感兴趣的条件相关的基因功能(即特定的发育阶段、组织类型或应激条件)[8- - - - - -10].

为了检测基因共表达网络中的功能簇(或模块),基于图聚类和引导(或种子)基因的技术已被成功应用。后一种方法通常需要先天的对引导基因功能的了解,并考虑给定引导基因的节点邻近网络(即在定义距离内的基因),n来自指定的引导基因)[91112].或者,图聚类算法,如马尔可夫聚类算法(MCL) [13],启发式簇凿算法(HCCA) [14]及加权相关网络分析(WCGNA) [15]已被广泛用于将复杂的植物基因共表达网络划分为定义的功能簇。

近年来,以甜橙、葡萄和番茄等水果作物为重点,rna测序的应用为不同胁迫、发育和环境环境下水果作物的转录组分析铺平了道路[16- - - - - -22].出于GCA的目的,来自RNA-seq研究的实验条件的综合目录仍然不完整。然而,历史微阵列数据为这些水果作物的全基因组共表达研究提供了基础[892324].值得注意的是,一种条件依赖的GCA结合引导基因搜索方法被用于识别柑橘中生物应激反应中的集群[23],同时结合条件依赖和独立,以及引导基因和基于聚类的方法,为葡萄浆果发育、光合作用和类黄酮代谢提供了新的见解[9].

在Affymetrix基因芯片柑橘基因组阵列(Affymetrix genchip citrus Genome Array)上,包括各种柑橘物种(主要是甜橙)、组织类型和胁迫实验在内的柑橘植物的全基因组转录分析研究已经广泛进行,该阵列代表了大约70%的转录组(基于甜橙基因组)。虽然这些研究主要基于对特定生物过程的理解,但整合这些异质数据集的GCA可以为假设驱动的柑橘基因发现提供功能基础。在这里,我们从297个公开可用的Affymetrix柑橘基因组阵列数据集推断出一个全局(条件独立)和四个手动分配(条件依赖)的柑橘GCNs。采用全基因组引导和GCNs图聚类,结合GO富集分析、基因表达信息和文献检索对聚类进行系统评估。

结果与讨论

概述-柑橘中生物学相关簇的鉴定

来自19个柑橘实验的297个公开的基因芯片柑橘基因组阵列数据集从NCBI基因表达综合存储库下载。有关每个数组数据集的描述可以在附加文件中找到1:表S1。根据亚种、组织类型和实验类型对这些数据集进行分类,结果表明,大部分样本来自甜橙(67%)和柑桔(14%),主要来自果实(63%)和叶片(23%)组织,并且经常来自生物胁迫处理(66%)(图)1;额外的文件1:表S2)。基于这些分类,所有与条件无关的数据集都被称为“柑橘”,而与条件相关的数据集,包括甜橙、水果、叶子和压力相关的数据集,今后将分别被称为“csin”、“水果”、“叶子”和“压力”。数据集分别进行处理和质量检查(参见材料和方法)。来自不同文献的最终表达矩阵被用于构建本研究中描述的条件无关和条件依赖的共表达网络。相关矩阵首先计算使用所有试探集(30,217)与皮尔逊相关系数(r)来定义探测集之间的表达式相似度。考虑到区分低表达基因和背景噪声的困难,以及为了为GCA提供足够的覆盖范围,将阵列上表示的所有探针集都包括在分析中。鉴于Affymetrix最初编译的genchip柑橘基因组阵列中每个探针的功能注释水平较低,甜橙基因组的最新基因注释[2]从素类批注计划[25].甜橙基因组注释,是基于循证注释的从头开始基因发现程序(详细描述于[2]),提供了甜橙基因的准确表达。因此,开始尝试重新注释探测集。通过使用每个探针集的一致序列,并对所有甜橙蛋白编码基因进行BLASTx搜索[2](在方法部分中描述),23,178个探针集(总共30,217个)被成功注释。同样,郑和赵先前进行的单独注释[23],基于拟南芥的同源同源,成功地将22,773个探针集与一个假定的功能联系起来。在大多数情况下,探针的注释与后一项研究相似。然而,这些注释的联合导致25147个探针集至少具有一个归属于每个探针集的假定功能(基于任何一种方法),这是对以前功能注释尝试的改进,并提供了对数组中所代表的柑橘基因的基因功能的更好概述。接下来,生r每个探针组之间关系的值转换为最高互易秩(HRR),作为基因共表达的指标。与互秩(MR)类似,HRR定义了感兴趣的两个实体(基因)之间的相互共表达关系,计算相对简单,对异常值具有鲁棒性,同时有效地保留了弱但显著的共表达关系[1426].从HRR值分布(100个微阵列数据排列)估计的HRR值的统计意义[27]显示的值在310和340之间(P < 0.01),并且在大多数情况下为推断共表达关系提供了合理的界限(附加文件)1:表S3)。该生物相关性值的HRR临界值与先前报道的拟南芥HRR GCN的临界值相似(HRR临界值≤228)[27]和葡萄藤(HRR截止值≤350)[9].此外,HRR值≤1200也具有统计学意义(P< 0.05)。虽然这一分析表明,HRR值≤340(和≤1200)在统计上是可靠的,以构建各种GCNs,但我们根据经验确定,前100名HRR(前100名)是可靠的k= 100)也是管理共表达基因列表同时保持生物学相关性(和统计学显著性)的合理阈值。以前的研究已经讨论了几个定义顶部k的例子th阈值(即前300个MR基因)非常适合使用引导基因方法设计基于共表达基因的生物实验[28].在本研究中使用这一阈值的基本原理是通过检查每个基因的前100个HRR值的分布来支持的(附加文件1:表S4)。HRR平均值在200 ~ 245之间,中位值在150 ~ 160之间;两者均远低于HRR值的统计显著性P< 0.01。此外,HRR值在下限百分位数(即5th和1)均有统计学意义或非常接近P< 0.05 limit(附加文件1:表S4)。这表明,这个阈值足够健壮,可以推断出有意义的共表达关系。几项植物基因共表达研究详细讨论了基因共表达的最佳阈值的定义问题,无论是从原始PCC还是从相互共表达等级(HRR和MR),以及其可能的解决方案[2728].其中包括定义相互共同表达等级的统计显著性[27或者定义一个顶部kth阈值(28],如前所述。在这项研究中(也是植物基因共表达研究中的第一次),我们利用了这两种不同的方法,表明每个基因的前100个HRR将是共表达基因列表的可管理性与其潜在基因共表达关系的统计能力之间的合理平衡,因此适用于从柑橘数据集推断的下游指导GCA。此外,然后应用氧化石墨烯富集分析对所有引导基因共表达聚类(30217个聚类)进行功能注释,并评估这些网络的预测性能(对每个引导基因使用前100个HRR内的共表达基因),以恢复富集的氧化石墨烯注释(表2)1).作为一种替代方法,当不知道目标基因的功能时,基于图聚类方法的密集连接模块识别使用MCL [13].MCL根据图的节点之间的转移概率或随机流的操作来划分底层图。该技术已被证明可以有效地识别高质量的功能簇,并且对噪声具有鲁棒性[2930.].MCL膨胀分数的参数优化()通常是最大化聚类性能所必需的(基于特异性、敏感性和f测度的衍生GO预测的质量)。使用这种方法,我们根据经验确定HRR30阈值是MCL的合理妥协,因为将阈值提高到HRR50(或更多)并不能提高聚类性能,而将阈值降低到HRR10则略微提高了聚类性能,但排除了更大一部分探测集(数据未显示)。在确定获得生物学相关簇的最佳HRR值时,也进行了类似的观察[27].此外,我们发现上述用于MCL聚类性能评估和参数优化的各种HRR评分(10、20、30、40和50)具有统计学意义(P< 2.95E-04)定义的所有条件(附加文件1:表S5)。与引导基因方法类似,对每个加权HRR30共表达网络的聚类特征和聚类性能的各种膨胀参数进行了评估(见材料和方法)。我们观察到一个MCL在大多数情况下,1.2和1.3参数对氧化石墨烯生物过程(BP)富集显著性的聚类效果最好(表2)1).来自各种方法(即数据集和MCL参数)的详细预测性能结果(f评分,特异性和敏感性)在附加文件中总结1:表S6。采用最优聚类方案,结合表达数据、基因本体(GO)富集和文献检索对每个模块进行系统表征。以往的共表达研究表明,参与翻译、光合作用和苯丙类代谢的基因普遍高度共表达,并在植物中密集聚集[2731].我们检测到几个基因簇在数据集上高度共表达,并通过上述过程进行丰富,证明了划分GCNs和识别生物相关簇的各种方法的鲁棒性(附加文件)1:表S7)。这些聚类可能具有有趣和新颖的共表达关系,我们强调了几个基因和聚类的例子,这些基因和聚类对柑橘水果生物学和柑橘产业应用都很重要,使用了引导和图聚类方法。

图1
图1

说明柑橘微阵列实验分类的柱状图。本研究共使用了19项公开的柑橘微阵列研究,包含297个数据集,包括广泛的实验条件和组织,并根据这些数据进行分类(一)柑橘亚种及(B)器官。其他统计数据可在附加文件1

表1本研究柑橘共表达网络特征综述

柑橘侧器官边界1 (LOB1)的新作用

柑橘细菌性溃疡病(CBC),一种由细菌引起的疾病黄citri柑桔亚种(Xcc),影响柑橘果实品种广泛,给产业造成巨大的经济损失。外侧器官边界1 (CsLob1)基因被各种白单胞菌(Xanthomonas)高度诱导[32- - - - - -34]并且最近被证明是CBC疾病发展的疾病易感(S)基因,涉及增生和肥大,可能是通过与参与扩张、生物合成和降解的细胞壁代谢基因相关[1733].然而,精确的功能和分子靶点Lob1还有待确定。为了提供有关作用模式的线索,使用探针进行了共表达分析Lob1(Cit.35190.1。S1_at和Cit.37210.1.S1_at)作为指南。使用条件无关的方法(即“柑橘”数据集),前100个基因与Lob1(cit . 37210.1.10 . s1_at)参与氧化磷酸化、ATP代谢和细胞呼吸,以及一些可能编码细胞壁代谢蛋白的探针。相比之下,在“叶子”和“胁迫”中进行条件依赖的共表达搜索显示,细胞壁相关基因(如膨胀素、聚半乳糖醛酸酶、果胶裂解酶和果胶甲基酯酶抑制剂蛋白)显著共表达和高度富集,支持了甜橙之间的假定关联Lob1和细胞壁相关酶(表2,附加文件2:表S1)。虽然细胞壁组织(GO:0071555)等GO BP术语在“叶子”和“压力”数据集中高度富集,这并不意外,但涉及DNA依赖DNA复制(GO:0006261)的术语的富集是有趣的(表2)2,附加文件2:表S2)。Lob1还与参与DNA复制和细胞周期调节的基因共表达,这表明细胞分裂、细胞壁代谢和Lob1,在此之前没有联系。在参与DNA复制/调控的共表达基因中,一个被注释为uv - b不敏感的基因4 (Uvi4)与高度共表达Lob1。Uvi4是后期促进复合物/环体的负调控因子,在拟南芥中控制细胞周期进程的表达,在表达改变的植物中可引起生长缺陷和影响防御[35].因此,CBC疾病发展过程中异常的细胞生长(分裂/增大)是通过Lob1可能涉及的附加行动Lob1在提高DNA含量和影响细胞周期依赖的基因表达以及调节细胞壁代谢方面发挥重要作用,因为异常生长可能归因于DNA含量增加和细胞周期进程紊乱[3536].Lob1还与其他基因共表达,如黄酮醇合成酶(Cit.871.1.S1_s_at)、白花青素双加氧酶(Cit.5282.1.S1_at)和转录因子(Anthocyaninless 2, Cit.7832.1.S1_at),当限制在“水果”数据集时,这些基因参与了花青素积累和类黄酮代谢(表2,附加文件2:表S1)。使用Lob1(Cit.35190.1.S1_at)作为导向基因。总的来说,我们证明了GCA可以被用来揭示各种可能的角色Lob1在柑橘类。这个例子也证明了探索条件无关的GCN ' citrus '和其他条件依赖的功能上下文GCNs的有用性,为涉及特定生理条件的bp提供了额外的见解。

表2引导基因共表达分析使用LOB1 (Cit.35190.1。S1_at及Cit.37210.1.S1_at)

柑橘中维生素C的代谢

抗坏血酸(Ascorbate, Asc)是一种有效的抗氧化剂,具有多种功能,如抵御氧化和光氧化胁迫、植物生长和发育,以及植物的激素和病原体反应[37].l -半乳糖途径是目前为止最普遍和被广泛理解的Asc生物合成途径,其中GME和gdp - l -半乳糖磷酸化酶/ gdp - l -半乳糖-己糖-1- p胍基转移酶(VTC2/5)的作用是Asc生物合成的主要控制点。其他途径,如d -半乳糖酸盐和Asc循环途径,提供了控制植物中Asc库的额外手段[38].为了深入了解柑橘中Asc的调控,研究人员将编码GME的基因Cit.23640.1。S1_s_at Cit.7984.1。S1_s_at Cit.7984.1。S1_at) was used in co-expression analysis. GME, the first committed enzyme of Asc biosynthesis is responsible for providing precursors (D-mannose and L-galactose) for biosynthesis of Asc and pectin network (cell wall) biogenesis [3940].有两个基因副本GME,即Gme1而且Gme2,编码在甜橙基因组中。在前100个共表达基因中GME1,是编码其他主要生物合成途径蛋白质的基因,如VTC2/5(Cit.21052.1。S1_x_at Cit.21052.1.S1_at),VTC1(Cit.29407.1.S1_s_at),VTC4(Cit.9252.1.S1_s_at)。它们与GME主要在叶子数据集(表3.,附加文件2:表S3 - S5)。进一步检查从这些数据集中推测的共表达基因列表中过度代表的GO术语,发现GO BP术语如l -抗坏血酸生物合成过程(GO:0019853,)、电子传递链(GO:0022900)和对激素刺激的反应(GO:0032870)显著富集(表3)3.,附加文件2:表S6)。相反,如果只吃水果,GME与编码果胶酯酶和果胶酯酶抑制剂的基因(Cit.13620.1)共表达。S1_at Cit.17421.1。S1_at, Cit.18581.1.S1_s_at),以及编码单脱氢抗坏血酸还原酶(Cit.3318.1.S1_at)的基因,Asc循环途径的一部分(表3.,附加文件2:表S3 - S5)。在这些共表达基因列表中,GO BP和MF术语如细胞壁组织和果胶酯酶活性显著富集(FDR < 0.001)3.,附加文件2:表S6)。总的来说,gme中心簇及其共表达基因的组织和条件特异性在叶片组织中更为显著,在柑橘类水果中也略有显著(附加文件)2:表S7)。l -半乳糖通路基因如协同表达GME而且VTC2/5这反映了在活跃的光合组织中,Asc在抵御氧化应激方面的需求[41].在柑橘果实中也观察到与主要Asc生物合成途径基因缺乏显著的共表达,在番茄果实中也观察到[42],表明一般水果中缺乏l -半乳糖通路基因的共同调节。草莓果实中d -半乳糖酸盐和Asc循环途径基因的特异性上调表明,Asc循环以及细胞壁生物发生和分解的协调可能与柑橘果实中Asc库的形成更为相关[43]和grape [2144].

表3引导基因共表达分析(Cit.23640.1。S1_s_at Cit.7984.1。S1_s_at Cit.7984.1。S1_at)

柑橘皮类异戊二烯和苯丙烷代谢

本示例将用于演示图聚类方法可用于推断柑橘中的共表达关系的情况。柑桔MCL簇14由328个节点组成,由1509条边密集连接,包含许多参与次生代谢和转录调控的基因(图2A).该模块中富集的GO父BP项如异戊二烯类(GO:0008299)、苯丙类(GO:0009699)生物合成工艺和MF项如氧化还原酶(GO:0016491)、转移酶(GO:0016740)、裂解酶(GO:0016829)活性均得到高度富集(表2)4;额外的文件3.:表S2)。簇内基因主要参与类异戊二烯前体(异戊二磷酸和二甲基烯丙基二磷酸)、单萜烯、倍半萜烯、黄酮、二氢黄酮醇、花青素、多甲氧基黄酮和脂肪酸的生物合成。此外,有许多基因被标记为细胞色素P450s和转移酶。由于在这个簇中没有明确的功能,这些基因有资格成为在柑橘苯丙烷和类异戊二烯途径的广泛性和特化分支中发现基因的有趣候选。一些属于AP2/ERF、bZIP、C2H2锌指和NAM转录因子家族(以及其他)的转录因子/调控因子与模块内的许多节点紧密相连(附加文件)3.:表S1)。特别令人感兴趣的是一个被标记为锌指/E3泛素连接酶蛋白(Cit.7748.1.S1_at)的探针,它与萜类/类固醇生物合成相关的基因如角鲨烯合成酶1 (SQS1;Cit.2904.1。S1_at, Cit.2903.1.S1_s_at)和甲戊酸二磷酸脱羧酶(MPDC, Cit.20947.1.S1_s_at),一种甾醇异构酶(HYD1, Cit.17372.1.S1_at),几个假定的细胞色素P450s(即Cit.31488.1. s1_s_at)。S1_at Cit.15705.1。S1_at Cit.2993.1。S1_at, Cit.29478.1.S1_s_at)和转录因子(Cit.15228.1. s1_s_at)。S1_at, Cit.19822.1.S1_s_at)(图2B、附加文件3.:表S2)。最近,E3泛素连接酶MKB1在m . truncatula与三萜皂苷生物合成途径基因和转录因子共表达,通过泛素-蛋白酶体系统负调控羟甲基戊二酰辅酶a还原酶HMGR(该途径的主要限速酶),从而负调控固醇和三萜皂苷生物合成[45].针对萜类/类固醇生物合成途径的不同控制点的类似机制可能存在于其他植物中。因此,推测的柑橘锌指/E3泛素连接酶蛋白(Cit.7748.1.S1_at)可能参与了柑橘其他控制点萜类/类固醇生物合成途径的调控。类似地,乙烯响应元件(ERE)结合蛋白1,(ERF13;Cit.17124.1。S1_at Cit.17124.1。S1_s_at Cit.29675.1。S1_s_at, Cit.4691.1.S1_at)与苯丙醇和类黄酮生物合成相关基因[即二氢类黄酮醇-4-还原酶(DFR, Cit.28072.1.S1_at)和类黄酮3'-羟化酶(F3'H;Cit.4610.1。S1_at, Cit.4610.1.S1_s_at)],激素代谢[即油菜素类固醇响应环- h2 (BRH; Cit.33331.1.S1_at)] as well as terpenoid metabolism [i.e. Terpene synthase 1(TPS; Cit.17284.1.S1_at) and phytoene synthase (PSY; Cit.22267.1.S1_at)] (Figure2C、附加文件3.:表S3)。虽然ERF13的分子靶点尚未阐明,但柑橘ERF13的共表达靶点与次生代谢有关。这支持了ERF13的应激和激素诱导性质,ERF13参与调节生长和发育,应激反应(生物和非生物),也赋予了拟南芥对ABA的超敏感性[4647].

图2
图2

预测的集群涉及柑橘皮类异戊二烯和苯丙烷代谢(citrus_cluster14)。(一)预测的Citrus MCL集群14包含328个节点,由1509条边密集连接。参与次级代谢(异戊二烯类和苯丙类)、细胞色素p450/甲基转移酶、脂代谢、激素代谢和信号/转录调节的基因在该聚类中过多代表,分别用紫色、深蓝色、橙色、红色和绿色表示。淡蓝色的节点表示编码多种功能蛋白质的基因(详情请参阅附加文件)。的子集群的说明(B)推测锌指/E3泛素连接酶蛋白(Cit.7748.1.S1_at)和(C)ERF13/乙烯响应元件(ERE)结合蛋白1 (Cit.17124.1。S1_at Cit.17124.1。S1_s_at Cit.29675.1。S1_s_at, Cit.4691.1.S1_at),在邻近距离为1的簇内与许多其他基因表现出高节点度(即紧密连接)。(D)在本研究中使用的297个组织和疾病的cESI图形表示,表达特异性指数大于1。彩色的方框突出了用于葡萄柚(红色)和甜橙(绿色)的果皮(flavedo)以及柠檬(黄色)的整个水果的实验条件。

表4柑桔MCL聚类富集的基因本体术语综述

对聚类表达特异性指数的检测显示,大部分基因(>70%)特异性表达在甜橙和葡萄柚的果皮(flavedo)中,但在柠檬的整个果实中表达较少(>50%),在叶、花和根组织中表达特异性较低(图)2D、附加文件3.:表S4)。显著连接的簇210和147共享功能共性(富集在次级代谢中),以及在其他密切相关的生物功能中富集,如丙酮酸代谢、糖酵解、氧化应激反应、细胞分裂素生物合成和花发育(附加文件)3.:表S5)。总体而言,柑橘14聚类中萜类和苯丙类通路相关基因显著共表达,且在柑橘果皮中显性表达。这表明存在一个复杂的调节网络,支持与颜色发育、苯丙类衍生物的合成和精油相关的次生代谢产物的组成,如在发育中的柑橘类水果中所见[48].对各种有趣节点的功能评估将为新途径成员和调控因子的发现提供下一步。

柠檬酸分解代谢和氨基丁酸分流

柠檬酸是柑橘类水果中主要的有机酸。这种酸在酸性和“无酸”或“甜”柑橘类水果中浓度的差异[49]可能是由于柠檬酸分解代谢的调节[50].柑橘类水果中柠檬酸的分解代谢与GABA分流有关,即(i)柠檬酸通过乌头酶和异柠檬酸脱氢酶活性转化为α-酮戊二酸(ii) α-酮戊二酸通过天门冬氨酸转氨酶或丙氨酸转氨酶转化为谷氨酸,(iii)谷氨酸通过谷氨酸脱羧酶转化为γ-氨基丁酸(GABA),(iv) GABA通过GABA转氨酶转化为琥珀酸半醛,(v)琥珀酸半醛通过琥珀酸半醛脱氢酶转化为琥珀酸,并反馈到TCA循环中[51].柑橘类水果中这种分流的拟议目的是降低高柠檬酸浓度对水果细胞细胞质pH值的影响,因为GABA的生物合成消耗了细胞质中的质子[51].

特定于水果的集群102(图3.A)含有推测的谷氨酸脱羧酶基因,它催化谷氨酸到GABA的质子消耗转化(Cit.9469.1.S1_at),以及推测编码吡吡啉-5-羧酸(P5C)还原酶(Cit.11550.1.S1_at)和P5C脱氢酶(Cit.22755.1.S1)的基因,分别催化脯氨酸到P5C的可逆转化和P5C到谷氨酸的不可逆转化(补充文件3.:表S6)。这表明,脯氨酸的分解代谢(除了柠檬酸的分解代谢)可以为柑橘类水果的GABA分流提供谷氨酸。在这个簇中也发现了一个假定的“钙结合EF手家族蛋白”基因的产物,可能与柑橘谷氨酸脱羧酶相互作用(附加文件)3.:表S7),如其他植物谷氨酸脱羧酶[综述,见[52]]。果实特异性簇102连接到果实特异性簇74(连通性评分>0.03),其中包含一个推测的nadp依赖性异柠檬酸脱氢酶基因(Cit.5273.1.S1_at),该基因不与任何其他TCA循环基因共表达,因此可能参与柠檬酸分解代谢和向GABA分流提供α-酮戊二酸,并可能单独受TCA循环控制。此外,该聚类富集了谷胱甘肽脱氢酶(抗坏血酸)活性(FDR 4.90E-03)(表5A).柠檬酸的分解代谢和GABA分流也与氧化应激反应有关[53].除了上述讨论的可能编码GABA转运酶的基因外,簇102还包含三个脱氢抗坏血酸还原酶基因(Cit.13490.1。S1_x_at Cit.13490.1。S1_at和Cit.23835.1.S1_s_at)、一个单脱氢抗坏血酸还原酶基因(Cit.3318.1.S1_at)和一个硫氧还蛋白基因(Cit.11597.1.S1_at),都可能在活性氧(ROS)清除中发挥作用。此外,一个推测的醌还原酶家族蛋白基因可能参与自由基的产生,以及一个NADH:泛醌氧化还原酶基因(Cit.14142.1.S1_at)可能参与氧化磷酸化(图3.A)在这个星团中被发现。

图3
图3

预测的聚类涉及GABA分流(fruit_cluster102)和柠檬酸分解代谢(fruit_cluster11)。(一)预测的果实MCL簇102包含76个基因,由242条边相连。参与蛋白质代谢、氧化还原、氨基酸代谢、脂质代谢和转录调控的基因分别用蓝色、紫色、红色、橙色和绿色表示。淡蓝色的节点表示编码多种功能/未知蛋白质的基因(详情请参阅附加文件)。(B)预测的果实MCL簇11包含238个基因,由1330条边紧密连接,形成一个中心簇。参与蛋白质代谢、应激、转录调控、TCA循环/线粒体电子转录和信号转导的基因分别用橙色、红色、绿色、黄色和紫色表示。淡蓝色的节点表示编码多种功能/未知蛋白质的基因(详情请参阅附加文件)。(C)表达特异性指数大于1的186个水果相关组织的聚类ESI的图形表示,在水果MCL聚类102(橙色柱)和11(黄色柱)中。红框为不同甜橙品种果实囊泡中果实特异性簇102和簇11成员的表达特异性。

表5果实MCL 102簇(A)和11簇(B)富集的基因本体术语综述

与此同时,水果特异性集群11(图3.B)包含213个节点,包括一个GABA转氨酶基因,该基因将GABA转化为琥珀酸半醛,为琥珀酸重新进入TCA循环做准备,3个推定的糖酵解基因(醛缩酶、烯醇化酶、葡萄糖-6-磷酸异构酶),5个推定的线粒体电子链基因(2个细胞色素c氧化酶和3个NADH:泛醌还原酶),39个推定参与调节基因转录和蛋白质翻译的基因。翻译后修饰和降解(附加文件3.:表S8)。有趣的是,该簇因热应激而富集(FDR 0.0205)5B)在其他基因本体中,假定的热休克蛋白由18个基因表示。因此,这些TCA循环、GABA分流和mETC基因可能对环境胁迫有反应。另外还发现了一个钙调蛋白基因(Cit.14580.1.S1_at)和一个钙调蛋白基因(Cit.14580.1.S1_at)2 +(Cit.12067.1.S1_s_at),这表明钙参与了应激条件下这些通路的调节,基于其子网络中的高共表达基因(附加文件)3.:表S9)。上面讨论的预测GABA转氨酶基因所在的水果特异性簇11也包含了可能编码10种金属硫蛋白、2种锰超氧化物歧化酶和2种抗坏血酸过氧化物酶的探针,所有这些都参与了ROS清除。该簇还包含一个与衰老相关的基因,该基因可能在氧化应激耐受中起作用,以及推测编码两种乙醇酸氧化酶的基因,这些酶产生H2O2(附加文件3.:表S8)。总的来说,在水果特异性MCL簇的背景下,柠檬酸分解代谢和GABA分流基因之间的共表达模式的探索突出了这些途径的假设基因与氧化应激反应相关的基因之间的关系,在不同甜橙品种(包括Navel、Valencia和Hamlin)的果泡中特异性表达(图2)3.C;额外的文件3.:表S10和S11)。这些基因在不同柑橘品种的果实中柠檬酸浓度的决定以及对非生物胁迫的响应中所起的作用有待进一步研究。

总结及未来发展方向

我们使用来自不同实验条件的数据集构建了柑橘的各种GCNs,包括Affymetrix柑橘基因组阵列上表示的所有探针集(约占预测的甜橙转录组的70%)。探针组的功能注释已更新,以包括来自甜橙基因组预测的新基因信息[2]和之前拟南芥的拟南芥谱系映射[23].GCNs用于评估几个聚类(包括基因中心和图分区),用于强调潜在生物技术应用的功能上下文。评估的聚类总体上证实了以前的报道,同时揭示了基因和聚类的共表达网络结构的新见解。我们强调了之前的一篇报道,该报道利用综合转录组比较和GCA来剖析GCN的潜在发病机制亚洲自由念珠菌甜橙的感染(黄龙病的致病因子,柑橘中最具破坏性的疾病之一)[23],目前的研究代表了迄今为止最全面的柑橘GCA,包括各种柑橘水果、器官和实验条件。然而,在常规的田间设置以及不同的应激条件(特别是非生物)和激素处理下,仍然需要更多的组织或器官样本的转录组学数据集来微调和改善当前的柑橘GCN。因此,当足够多的新的公开柑橘微阵列实验发布时,将这些新数据纳入各种柑橘GCN将是必要的。同样,随着rna测序技术在柑橘基因表达分析中的应用越来越多,而微阵列技术[2195455],基于rna测序的GCA也将在未来进行。与微阵列平台相比,rna测序具有固有的优势,可以更好地表示和定量基因转录物,以及更好地区分异构体或密切相关的序列[56].此外,顺式调控、miRNA、蛋白质- dna和蛋白质-蛋白质相互作用的整合将在未来引起极大兴趣,因为这些数据最终将增强我们对模式植物拟南芥中所见的多个相互连接网络层次结构中的基因和编码蛋白质的理解。例如,结合甜橙预测蛋白质-蛋白质相互作用网络数据可从CAP [25]转化为GCNs将是改进柑橘基因功能预测的下一步。为此,我们开发了一个名为“柑橘共表达网络推断”(NICCE)的在线公开数据库资源(http://citrus.adelaide.edu.au/nicce/home.aspx).NICCE包含从非目标和手动定义的条件推断的GCNs,适用于条件无关和条件依赖的共表达方法。到目前为止,主要工具包括搜索与感兴趣的关键字匹配的探测集(即柑橘基因ID, GO ID/描述),搜索包含丰富GO术语/描述的探测集或集群,以及探索单个集群和网络信息的实用程序。辅助解释GCN的其他工具,如GO富集分析,使用CytoscapeWeb的网络可视化工具[57]、柱状图和热图也已提供。当新的公开的微阵列实验和改进的甜橙基因组基因预测可用时,NICCE的年度更新将进行。未来还将考虑从公共领域累积rna测序数据集推断出的GCN集成到NICCE中。关于NICCE的全面教程可以在附加文件中找到4或访问NICCE网站。NICCE可以使用包括Chrome和Firefox在内的现代网络浏览器访问,这些浏览器启用了Javascript,并安装了Flash插件,以实现性能和网络可视化。

结论

我们提供了一个适用于柑橘属的GCN推断的综合框架,并表明可以在这些聚类中获得有意义的共表达关系。共表达网络结构、共表达基因功能富集、基因表达特异性和文献资料支持了相关基因和聚类。在这项研究中,我们包括了生物学上相关的基因和集群的例子,这些基因和集群对柑橘产业很重要。我们还描述了NICCE (Network Inference for Citrus Co-Expression),http://citrus.adelaide.edu.au/nicce/home.aspx),一个用户友好的门户网站,为柑橘研究人员提供了全面的工具,以快速挖掘和解释有趣的基因和簇的共表达关系。

方法

原始表达式数据和预处理

共有297个公开可用的Affymetrix genchip柑橘基因组微阵列数据集,测量了大约33,000个转录本的转录活性(~70%的转录组覆盖率),从NCBI基因表达Omnibus检索。使用RMAExpress处理原始CEL文件(http://rmaexpress.bmbolstad.com/),使用默认设置计算稳健的多阵列平均(RMA)表达式值。共有18个未通过探针级、基于模型的质量评估的潜在离群点阵列被丢弃,保留279个阵列用于进一步分析。在共表达网络分析之前,控制探针也被移除。使用所有279个阵列构建了柑橘物种的广义条件无关共表达网络分析。基于相关元数据(根据亚种、组织样本和实验条件进行分类),还分别构建了几个条件依赖的共表达网络。最后,通过应用下面的程序,为泛化的、亚种的、组织的和压力特定的数据集生成基因共表达网络。

秩计算和共表达网络构建

利用皮尔逊相关系数(r)作为表达值之间相似性的度量,首先计算相关矩阵。的r所有共表达基因对的值按的升序转换为秩r对于每个探针集。使用公式(1)HRR(A,B) = [max(rank(A,B), rank(B,A))],其中rank(A,B)是根据基因A的共表达列表转换后的基因B的rank,反之亦然,对于rank(B,A) [14].HRR被用作基因共表达的指标,并用于上述基因共表达网络的构建。每个个体网络的HRR显著性是根据100个排列来估计的,按[27].通过将每个基因视为“种子”或“向导”,并将给定基因的前100个HRR内的所有基因视为单个集群,创建了基因组规模的、以基因为中心的共表达集群。这导致总共30,217个簇(即阵列上表示的探针集的数量),在全基因组范围内共享潜在重叠的共表达基因。图聚类采用马尔科夫聚类算法(Markov Cluster Algorithm, MCL) [13]使用MCL版本12-068 (http://micans.org/mcl/)与不同的通货膨胀值,,在1.1和2.0之间,以及不同的HRR界限,以识别功能集群。使用不同的截断值生成HRR网络,其中权重为0.2、0.067、0.04、0.028和0.022的HRR截断值分别为10、20、30、40和50,用于性能评估。少于3个探针的预测簇通常在生物学上没有意义,因此被删除。

评估功能丰富,聚类特征和聚类性能

评估基因本体(GO)术语在聚类中的过度表示使用BiNGO [58].采用超几何分布调整Benjamini & Hochberg错误发现率(FDR)进行多重假设修正,评估聚类内所有GO生物过程(BP)、分子功能(MF)和细胞成分(CC)项的统计显著性。如果校正p值(FDR) < 0.05且至少有2个基因与同一注释相关,则认为GO注释项显著。基于MCL的聚类性能评估通过计算在FDR < 0.05处富集一个注释的模块比例(表示为特异性)和在FDR < 0.05处富集至少一个模块的注释比例(表示为敏感性)来确定,这些注释至少有2个基因与富集的注释相关[59].然后将特异性和敏感性值总结为功能富集评分(F-measure),计算为特异性和敏感性之间的调和平均值[(2 ×特异性×敏感性/(特异性+敏感性)]。Probeset表达特异性根据[60通过在微阵列检测中标准化基因表达值,然后在微阵列检测之间标准化。当探针表达特异性指标值分别为> 1和> 5时,在相应的实验条件下,A基因被认为表达良好,具有特异性。类似地,聚类累积表达特异性指数(cESI)被定义为在特定组织或疾病(以及所有阵列)中特异性表达特异性指数高于1的聚类成员的比例,根据[9].

基因注释与网络可视化

柑橘探测组先前基于同源性和orthology搜索对拟南芥基因组和NCBI最佳blast命中的注释从Zheng和Zhao [23]及CitrusPLEX [61],并合并为一个包含引用ID (Ref_ID)、引用源(Ref_Source)、引用描述(Ref_Desc)、E-value和百分比标识(如适用)的注释表。使用从NCBI网站(NCBI - BLAST -2.2.29+)下载的本地BLAST (NCBI - BLAST -2.2.29+)进行了针对最新甜橙基因组注释的映射的更新。ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/).简单地说,使用BLASTx将代表每个探针集(共30,217个)的一致序列映射到最新的甜橙基因组注释,默认设置中e值和身份截断值分别为1e-20和40%。该搜索的最佳爆炸命中被认为是阵列中潜在探针集的代表性甜橙基因标识符。此外,使用Blast2GO管道对Citrus探针进行电子推断GO分配[62]已从AgriGO下载中心(http://bioinfo.cau.edu.cn/agriGO/download.php)在BinGO中进行GO富集分析[58].节点和边缘属性的可视化使用Cytoscape 2.8中引入的特征的组合进行[63]及CytoscapeWeb [40].

参考文献

  1. 刘勇,何英,Tanumihardjo SA:柑橘类水果的历史、全球分布及营养重要性。食品科学与安全综合评述。2012,11(6):530-545。

    文章中科院谷歌学者

  2. 徐强,陈丽丽,阮旭,陈东,朱安,陈超,Bertrand D,焦伟斌,郝bh, Lyon MP,陈俊,高松,邢峰,兰红,常建文,葛鑫,雷勇,胡强,苗勇,王玲,肖胜,Biswas MK,曾伟,郭峰,曹辉,杨欣,徐小文,程玉军,徐俊,刘建辉,等:甜橙基因组草案(素类).植物学报,2013,45(1):59-66。doi: 10.1038 / ng.2472。Epub 2012 11月25日

    文章中科院PubMed谷歌学者

  3. Gmitter F, Chen C, Machado MA, Souza AA, Ollitrault P, Froehlicher Y, Shimizu T:柑橘基因组学。树木遗传与基因组学报,2012,8(3):611-626。

    文章谷歌学者

  4. Usadel B, Obayashi T, Mutwil M, Giorgi FM, Bassel GW, Tanimoto M, Chow A, Steinhauser D, Persson S, Provart NJ:植物生物学的共表达工具:假设生成的机会和警告。植物细胞环境,2009,32(12):1633-1651。

    文章中科院PubMed谷歌学者

  5. López-Kleine L, Leal L, López C:基于转录组数据重建基因共表达网络的生物统计学方法。中国生物医学工程学报,2013,12(5):457-467。

    文章PubMed谷歌学者

  6. Saito K, Hirai MY, Yonekura-Sakakibara K:用共表达网络和代谢组学解码基因-“大多数由预言报告”。植物科学进展,2008,13(1):36-43。

    文章中科院PubMed谷歌学者

  7. 杨晓明,杨晓明,杨晓明:植物基因共表达网络中实用信息的提取方法。植物生理学报,2007,34(3):381- 381。

    文章中科院PubMed谷歌学者

  8. Fukushima A, Nishizawa T, Hayakumo M, Hikosaka S, Saito K, Goto E, Kusano M:利用图聚类和差分共表达方法探索基于共表达模块的番茄基因功能。中国生物医学工程学报,2012,29(4):357 - 357。

    公共医学中心文章中科院PubMed谷歌学者

  9. 黄德杰,黄志强,黄志强,黄志强,黄志强,刘志强,刘志强。作物基因共表达库的建立葡萄(小道消息)。BMC基因组学杂志,2013,14 (1):882-

    公共医学中心文章PubMed谷歌学者

  10. 蔡尔兹KL,戴维森RM, Buell CR:基因共表达网络分析作为水稻基因功能注释的来源。公共科学学报,2011,6 (7):e22196-

    公共医学中心文章中科院PubMed谷歌学者

  11. Obayashi T, Hayashi S, Saeki M, Ohta H, Kinoshita K: ATTED-II提供拟南芥的共表达基因网络。核酸研究,2009,37(增编1):D987-D991。

    公共医学中心文章中科院PubMed谷歌学者

  12. Sato Y, Namiki N, Takehisa H, Kamatsuki K, Minami H, Ikawa H, Ohyanagi H, Sugimoto K, Itoh J-I, Antonio BA, Nagamura Y:水稻共表达基因网络检索平台。中国生物医学工程学报,2013,41 (D1): D1214-D1221。

    公共医学中心文章中科院PubMed谷歌学者

  13. Enright AJ, Van Dongen S, Ouzounis CA:一种高效的蛋白质家族检测算法。中国生物医学工程,2002,30(7):1575-1584。

    公共医学中心文章中科院PubMed谷歌学者

  14. Mutwil M, Usadel B, Schütte M, Loraine A, Ebenhöh O, Persson S:基于启发式聚类算法的拟南芥基因组交互相关网络构建。中国生物医学工程学报,2010,32(1):344 - 344。

    公共医学中心文章中科院PubMed谷歌学者

  15. Langfelder P, Horvath S: WGCNA:加权相关网络分析的R包。生物信息学,2008,9 (1):559-

    公共医学中心文章PubMed谷歌学者

  16. Zouari I, Salvioli A, Chialva M, Novero M, Miozzi L, Tenore G, Bagnaresi P, Bonfante P:从根到果:RNA-Seq分析表明丛枝菌根共生可能影响番茄果实代谢。BMC基因组学杂志,2014,15 (1):221-

    公共医学中心文章PubMed谷歌学者

  17. Pereira A, Carazzolle M, Abe V, de Oliveira M, Domingues M, Silva J, Cernadas R, Benedetti C:柑桔溃疡病病原TAL效应靶点的鉴定显示了疾病发展和防御反应的功能收敛。BMC基因组学杂志,2014,15 (1):157-

    公共医学中心文章PubMed谷歌学者

  18. 肖王Y,道X, X m, L,太阳J-l,燕即xf,李D,邓H-Y,马X r:西红柿比较转录组分析(茄属植物lycopersicum)对外源脱落酸的反应。BMC基因组学杂志,2013,14 (1):841-

    公共医学中心文章中科院PubMed谷歌学者

  19. 罗丽娟,李志刚,李志刚,马夏多在早期阶段Xylella fastidiosa感染显示生长素相关基因作为一种防御反应。BMC基因组学杂志,2013,14 (1):676-

    公共医学中心文章中科院PubMed谷歌学者

  20. 于凯,徐强,达旭,郭峰,丁勇,邓霞:甜橙果实发育和成熟过程中转录组的变化(素类).BMC基因组学杂志,2012,13 (1):10-

    公共医学中心文章中科院PubMed谷歌学者

  21. Sweetman C, Wong DCJ, Ford CM, Drew DP:葡萄果实发育4个阶段的转录组分析(葡萄简历。设拉子)提供了调控和协调基因表达的见解。BMC基因组学杂志,2012,13 (1):691-

    公共医学中心文章中科院PubMed谷歌学者

  22. Perazzolli M, Moretto M, Fontana P, Ferrarini A, Velasco R, Moser C, Delledonne M, Pertot I:霜霉抗性诱导木霉属harzianum易感葡萄中的T39部分模拟了抗性基因型的转录变化。BMC基因组学杂志,2012,13 (1):660-

    公共医学中心文章中科院PubMed谷歌学者

  23. 郑志林,赵颖:通过转录组比较和基因共表达网络分析,为柑桔对'亚洲自由念珠菌的感染。BMC基因组学杂志,2013,14 (1):27-

    公共医学中心文章中科院PubMed谷歌学者

  24. Ozaki S, Ogata Y, Suda K, Kurabayashi A, Suzuki T, Yamamoto N, Iijima Y, Tsugane T, Fujii T, Konishi C, Inai S, Bunsupa S, Yamazaki M, Shibata D, Aoki K:番茄基因的共表达分析和在功能丰富的共表达模块中发现的基因协调表达的实验验证中国生物医学工程学报,2010,17(2):105-116。

    公共医学中心文章中科院PubMed谷歌学者

  25. 王娟,陈东,雷勇,常建文,郝宝华,邢峰,李松,徐强,邓晓霞,陈丽丽:素类注释计划(CAP):建立甜橙基因组综合数据库。公共科学学报,2014,9 (1):e87723-

    公共医学中心文章PubMed谷歌学者

  26. Obayashi T, Kinoshita K:相关系数等级作为基因共表达生物学意义的可比性度量。中国生物医学工程学报,2009,26(5):344 - 344。

    公共医学中心文章中科院PubMed谷歌学者

  27. Mutwil M, Klie S, Tohge T, Giorgi FM, Wilkins O, Campbell MM, Fernie AR, Usadel B, Nikoloski Z, Persson S: PlaNet:来自七个物种的植物网络的组合序列和表达比较。植物细胞学报,2011,23(3):895-910。

    文章中科院谷歌学者

  28. Obayashi T, Kinoshita K: ATTED-II中的共表达景观:不同类型通路的基因列表和基因网络的使用。植物保护学报,2010,29(3):344 - 344。

    文章中科院PubMed谷歌学者

  29. 王晓明,王晓明,王晓明,等。基于马尔可夫聚类和亲和传播的蛋白质相互作用图划分方法。生物信息学学报,2009,10 (1):99-

    公共医学中心文章PubMed谷歌学者

  30. 王晓峰,王晓峰,王晓峰。基于聚类算法的蛋白质相互作用网络研究。生物信息学学报,2006,7 (1):488-

    公共医学中心文章PubMed谷歌学者

  31. Netotea S, Sundell D, Street N, Hvidsten T: ComPlEx:共表达网络的保守性和差异性答:芥杨树而且o .漂白亚麻纤维卷.BMC基因组学杂志,2014,15 (1):106-

    公共医学中心文章PubMed谷歌学者

  32. Cernadas RA, Camillo LR, Benedetti CE:甜橙与柑橘腐烂病菌Xanthomonas axonopodis pv相互作用的转录分析。柑橘属和轴突白单胞菌。aurantifolii。植物病理学杂志,2008,9(5):609-631。

    文章中科院PubMed谷歌学者

  33. 李震,邹玲,叶刚,熊玲,季震,Zakria M,洪楠,王刚,陈庚:一种潜在的疾病易感基因CsLOB柑橘的主要毒力效应物PthA的目标黄citri无性系种群。citri.分子植物学报,2014,7(5):912-915。

    文章中科院PubMed谷歌学者

  34. 胡勇,张静,贾宏,Sosso D,李涛,Frommer WB,杨波,White FF,王楠,Jones JB:器官外侧边界是柑橘细菌性溃疡病的易感基因。中国生物工程学报,2014,29(4):344 - 344。

    公共医学中心文章中科院PubMed谷歌学者

  35. 鲍忠,杨辉,华娟:细胞周期调控的扰动通过激活抗病基因引发植物免疫应答。自然科学进展,2013,30(6):344 - 344。

    公共医学中心文章中科院PubMed谷歌学者

  36. 刘震,姚宁,陆华,刘志明:拟南芥防御反应与细胞命运变化交互。公共科学学报,2013,8 (12):e83219-

    公共医学中心文章PubMed谷歌学者

  37. 葛斯特N,戈蒂埃H,史蒂文斯R:抗坏血酸从植物进化的角度看:一个成功分子的崛起?应用实验学报,2013,64(1):33-53。

    文章中科院PubMed谷歌学者

  38. Valpuesta V, Botella MA:植物中l -抗坏血酸的生物合成:旧抗氧化剂的新途径。植物科学进展,2004,9(12):573-577。

    文章中科院PubMed谷歌学者

  39. Gilbert L, Alhagdow M, Nunes-Nesi A, Quemener B, Guillon F, Bouchet B, Faurobert M, Gouble B, Page D, Garcia V, Petit J, Stevens R, Causse M, Fernie AR, Lahaye M, Rothan C, Baldet P: GME在番茄抗坏血酸和非纤维素细胞壁生物合成的交叉点起关键作用。植物学报,2009,30(3):379 - 379。

    文章中科院PubMed谷歌学者

  40. Voxeur A, Gilbert L, Rihouey C, Driouich A, Rothan C, Baldet P, Lerouge P: GDP- D -甘露糖3,5-表素酶的沉默对番茄果胶多糖鼠李糖乳聚糖II结构和交联的影响生物化学学报,2011,28(3):344 - 344。

    公共医学中心文章中科院PubMed谷歌学者

  41. 皇冠伏特加N:抗坏血酸的生物合成和光保护功能。中国生物医学工程学报,2000,29(3):344 - 344。

    公共医学中心文章中科院PubMed谷歌学者

  42. Lima-Silva V, Rosado A, amorrin - silva V, Munoz-Merida A, Pons C, Bombarely A, Trelles O, Fernandez-Munoz R, Granell A, Valpuesta V, Botella MÁ:遗传和全基因组转录组分析确定了番茄果实中氧化反应和激素转录丰度与维生素C含量的共同调控。BMC基因组学杂志,2012,13 (1):187-

    公共医学中心文章中科院PubMed谷歌学者

  43. Cruz-Rus E, Amaya I, Sánchez-Sevilla JF, Botella MA, Valpuesta V:草莓果实中l -抗坏血酸含量的调控。实验学报,2011,62(12):4191-4201。

    公共医学中心文章中科院PubMed谷歌学者

  44. Melino V, Soole K, Ford C:葡萄浆果成熟过程中抗坏血酸代谢及酒石酸和草酸的发育需求。植物学报,2009,9 (1):145-

    公共医学中心文章PubMed谷歌学者

  45. Pollier J, Moses T, Gonzalez-Guzman M, De Geyter N, Lippens S, Bossche RV, Marhavy P, Kremer A, Morreel K, Guerin CJ, Tava A, Oleszek W, Thevelein JM, Campos N, Goormachtig S, Goossens A:蛋白质质量控制系统管理植物防御化合物的合成。自然科学进展,2013,38(4):344 - 344。

    文章中科院PubMed谷歌学者

  46. Oñate-Sánchez L, Singh KB:病原菌侵染后拟南芥乙烯响应元件结合因子的鉴定。中国生物医学工程学报,2002,29(4):344 - 344。

    公共医学中心文章PubMed谷歌学者

  47. 刘建华,李敏,刘建华,金松:CE1结合蛋白的分离与功能鉴定。中国生物医学工程学报,2010,10 (1):277-

    文章谷歌学者

  48. Voo SS, Grimes HD, Lange BM:评估柑橘皮分泌腺的生物合成能力。中国生物医学工程学报,2012,29(1):344 - 344。

    公共医学中心文章中科院PubMed谷歌学者

  49. Albertini M-V, Carcouet E, Pailly O, Gambotti C, Luro F, Berti L:酸性和无酸性柑橘果实发育早期有机酸和糖的变化。农业化学学报,2006,54(21):8335-8339。

    文章中科院PubMed谷歌学者

  50. Shimada T, Nakano R, Shulaev V, Sadka A, Blumwald E:柑桔汁细胞液泡柠檬酸/H +转运体。植物学报,2006,24(2):482 - 482。

    文章中科院PubMed谷歌学者

  51. Cercós M, Soler G, Iglesias D, Gadea J, Forment J, Talón M:柑桔果肉发育成熟过程中基因表达的全局分析。一种提出的柠檬酸利用机理。植物分子生物学学报,2006,29(4):513-527。

    文章PubMed谷歌学者

  52. Bouché N, Fromm H:植物中的GABA:只是一种代谢物?。植物科学进展,2004,9(3):110-115。

    文章PubMed谷歌学者

  53. 孙鑫,朱安,刘胜,盛磊,马强,张磊,Nishawy EME,曾颖,徐娟,马志,程勇,邓欣:代谢组学与亚细胞器表达芯片集成技术在柑桔果实采后有机酸变化研究中的应用。中国生物医学工程学报,2013,29(3):344 - 344。

    文章中科院PubMed谷歌学者

  54. Martinelli F, Uratsu SL, Albrecht U, Reagan RL, Phu ML, Britton M, Buffalo V, Fass J, Leicht E, Zhao W, Lin D, D’souza R, Davis CE, Bowman KD, Dandekar AM:柑橘果实对黄龙冰病应答的转录组分析。公共科学学报,2012,7 (5):e38039-

    公共医学中心文章中科院PubMed谷歌学者

  55. 吴娟,徐忠,张勇,柴林,易华,邓鑫:对一个晚熟甜橙自发突变体及其野生型果肉转录组和蛋白质组的综合分析提高了我们对柑橘果实成熟的认识。实验学报,2014,65(6):1651-1671。

    公共医学中心文章中科院PubMed谷歌学者

  56. 王志强,王志强,王志强:RNA-Seq:转录组学的革命性工具。植物学报,2009,10(1):57-63。

    公共医学中心文章中科院PubMed谷歌学者

  57. Lopes CT, Franz M, Kazi F, Donaldson SL, Morris Q, Bader GD: Cytoscape Web:基于Web的交互式网络浏览器。生物信息学,2010,26(18):2347-2348。

    公共医学中心文章中科院PubMed谷歌学者

  58. Maere S, Heymans K, Kuiper M: BiNGO:一个评估生物网络中基因本体类别过度表示的Cytoscape插件。生物信息学,2005,21(16):3448-3449。

    文章中科院PubMed谷歌学者

  59. 王娟,李敏,邓艳,潘艳:蛋白质相互作用网络聚类方法研究进展。BMC基因组学杂志,2010,11(增刊3):S10-

    文章中科院谷歌学者

  60. 杨春华,杨春华,杨春华,杨春华。植物共表达基因模块的研究进展。生物信息学,2010,26(9):1267-1268。

    文章中科院PubMed谷歌学者

  61. 陈晓明,王晓明,王晓明,王晓明,等。植物病原菌基因表达资源分析。中国生物医学工程学报,2012,40 (D1): D1194-D1201。

    公共医学中心文章中科院PubMed谷歌学者

  62. Conesa A, Götz S, García-Gómez JM, Terol J, Talón M, Robles M: Blast2GO:功能基因组学研究中注释、可视化和分析的通用工具。生物信息学,2005,21(18):3674-3676。

    文章中科院PubMed谷歌学者

  63. 汪培林,王培林,王晓明,王晓明。细胞景观2.8:数据集成和网络可视化的新特性。生物信息学,2011,27(3):431-432。

    公共医学中心文章中科院PubMed谷歌学者

下载参考

确认

我们感谢Citrus研究社区在公共领域提供各种微阵列数据。DCJW由阿德莱德大学研究生研究奖学金资助。

作者信息

从属关系

作者

相应的作者

对应到克里斯托弗·M·福特

额外的信息

相互竞争的利益

作者宣称他们之间没有利益冲突。

作者的贡献

DCJW构思本研究,编译分析微阵列数据,进行共表达数据分析,构建数据库平台,撰写稿件。CMF和CS参与研究共表达数据分析、设计和协调,并协助起草手稿。所有作者均已阅读并批准最终稿。

电子辅助材料

12870 _2014_1594_moesm1_esm.xlsx

附加文件1:描述用于构建柑橘共表达网络的Microarray数据集和相关元数据。表S1显示了本研究中使用的Affymetrix柑橘基因组阵列数据集,包括GEO实验ID、GEO接入ID、标题和描述柑橘亚种、器官、实验类型和一般管理描述的4个手动分类。表S2根据柑橘亚种、器官/组织类型、实验类型显示数据集的分类,并显示阵列数据集的数量和每种分类类型相对于总数的比例。表S3包含各数据集中HRR值的估计统计意义P< 0.01,P< 0.05。表S4包含各种数据集中所有引导基因的前100个HRR值(共30,217个)的平均值、中位数和百分位分布。红色标注值表示HRR值低于HRR阈值P < 0.05有统计学意义。表S5包含了P用于MCL图聚类预测性能的HRR值10,20,30,40和50的-value显著性。表S6包含各种数据集的详细预测性能结果和MCL聚类参数)。表S7包含在不同数据集上使用MCL预测的聚类示例和相关信息(即GO ID、GO类型、GO描述、MCL膨胀、条件、输入#、背景#、p值和FDR),包含富集于翻译、光合作用和苯丙类代谢的GO生物过程。(xlsx51 kb)

12870 _2014_1594_moesm2_esm.xlsx

附加文件2:柑橘LOB1和GME的指导GCA结果的详细信息。excel表格包含7个表,描述指南GCA的分析结果。表S1包含与的共表达基因列表LOB1(cit . 37210.1.10 . s1_at)横跨柑橘、csin、水果、叶子和压力数据集,以浅橙色、蓝色、紫色、绿色和红色突出显示。表S2包含丰富的GO术语的全球概述LOB1(cit . 37210.1.10 . s1_at)基因在所有柑橘、csin、果实、叶片和胁迫数据集中共表达。表S3 ~ S5包含与的共表达基因列表GMEprobesets Cit.23640.1。S1_s_at Cit.7984.1。S1_s_at和Cit.7984.1。分别S1_at。与表S1类似,来自柑橘、csin、水果、叶子和压力数据集的共表达基因列表以浅橙色、蓝色、紫色、绿色和红色突出显示。表S6包含丰富的GO术语的全球概述GME(Cit.23640.1。S1_s_at Cit.7984.1。S1_s_at和cit . 7981 . s1_at)在所有柑橘、csin、果实、叶片和胁迫数据集中共表达基因。表S7包含gme中心簇的组织和条件表达特异性。每个数组数据集的详细描述以及每个数据集中前6个共表达探针集的对应ESI值。(xlsx747 kb)

12870 _2014_1594_moesm3_esm.xlsx

附加文件3:柑橘MCL集群14和水果MCL集群102和11的图聚类结果的详细描述。excel表格包含11个表,描述柑橘类MCL聚类14和水果类MCL聚类102和11的分析结果。表S1, S6和S8包含属于相关簇的基因列表和相关信息,如条件、簇ID、探测集ID、符号、预测功能、拟南芥和甜橙的最佳基因ID匹配。表S2包含GO (ID、类型、描述)、输入#、后台#、p值、FDR等详细信息,以及相关集群丰富GO术语的输入列表。表S3, S7和S9包含相关簇内所有共表达基因关系和相关相互作用权重的列表。对于表S3,橙色和绿色突出显示的行描述了推测的锌指/E3泛素连接酶蛋白(Cit.7748.1.S1_at)和ERF13/乙烯反应元件(ERE)结合蛋白1 (Cit.17124.1.)的共表达关系。S1_at Cit.17124.1。S1_s_at Cit.29675.1。S1_s_at, Cit.4691.1.S1_at)子集群。对于表S7,蓝色突出显示的行描述了假定的“钙结合EF手家族蛋白”基因(Cit.18972.1.S1_at)的共表达关系,绿色突出显示了其与谷氨酸脱羧酶(Cit.9469.1.S1_at)的共表达关系。对于表S9,以橙色和红色突出显示的行分别描述了一个假定的钙调蛋白基因(Cit.14580.1.S1_at)和一个假定参与细胞钙离子感应的基因(Cit.12067.1.S1_s_at)的共表达关系。表S4、S10和S11包含相关的集群组织/条件表达特异性表,其中详细描述了每个阵列数据集和cESI(分数)值,这些值已被彩色编码。表S5包含级别、连接分数、显著连接集群等信息,以及显著连接集群的GO(类型、描述和FDR值)。(xlsx28kb)

12870 _2014_1594_moesm4_esm.pdf

附加文件4:使用NICCE的柑橘类GCA综合教程。该pdf文件包含了NICCE的详细描述和教程,以及它在柑橘中使用基因表达信息和共表达网络发现基因功能的应用。(pdf 4mb)

作者提交的图片原始文件

下面是作者提交的原始图片文件的链接。

图1作者的原始文件

图2作者的原始文件

图3作者的原始文件

权利和权限

开放获取本文遵循知识共享署名4.0国际许可协议,允许以任何媒介或格式使用、分享、改编、分发和复制,只要您对原作者和来源给予适当的署名,提供知识共享许可协议的链接,并注明是否有更改。

本文中的图像或其他第三方材料包含在文章的创作共用许可协议中,除非在材料的信用额度中另有说明。如果材料未包含在文章的创作共用许可协议中,并且您的预期使用不被法定法规所允许或超出了允许的使用范围,您将需要直接获得版权所有者的许可。

如欲查看本牌照的副本,请浏览https://creativecommons.org/licenses/by/4.0/

创作共用公共领域奉献弃权书(https://creativecommons.org/publicdomain/zero/1.0/)适用于本条所提供的资料,除非在资料的信用额度中另有说明。

转载及权限

关于本文

通过CrossMark验证货币和真实性

引用本文

黄,d.c.,斯威特曼,C.和福特,C.M.使用基因表达信息和共表达网络注释柑橘基因功能。BMC植物生物学14日,186(2014)。https://doi.org/10.1186/1471-2229-14-186

下载引用

  • 收到了

  • 接受

  • 发表

  • DOIhttps://doi.org/10.1186/1471-2229-14-186

关键字

  • 基因本体论
  • 柑橘类水果
  • 甜橙
  • 图集群
  • 琥珀Semialdehyde