跳到主要内容

利用转录组数据的开发和表征基于基于基于SSR标记的油棕榈耐寒性耐寒性标记物(油棕

摘要

背景

油棕(油棕,2牛 = 32)在所有作物品种中具有最高的产油量,并且包含最丰富的维生素原A饮食来源。热带树种的最佳平均生长温度为27℃左右,最低生长温度为15℃。因此,种植面积限制在10°N至10°S的地理范围内。增强耐寒能力将增加该热带物种的总种植面积和随后的产油量。开发与抗寒性相关的分子标记将有助于抗寒性的分子育种油棕

结果

在51452个表达序列中,共鉴定出5791个基于基因的ssr油棕转录组数据:每10个表达序列检测到大约一个SSR。在这5791个基于基因的ssr中,有916个来自表达序列在寒冷胁迫下上调或下调至少两倍。共产生182个多晶型标记物,其特征在于442个引物对,侧翼这些冷响应SSR重复。这些多晶型SSR标记的多态信息内容(PIC)跨越24行油棕不同的0.08至0.65(平均值= 0.31±0.12)。使用硅片结果表明,182个多态性SSR标记中的137个(75.3%)定位在16个SSR标记上油棕染色体。实现了473 MBP的总覆盖率,平均物理距离为3.4mbp之间的相邻标记(范围96bp - 20.8 mbp)。同时,在冷凝压下转录组的比较分析显示了一个ICE1.推定的直播,五CBF公司假定直系同源,19南汽转录因子和四种冷诱导的镁菌蛋白响应于冷应激而上调至少两倍。有趣的是,Unigene21287的5'未翻译区域(ICE1.)和cl2628.contig1(南汽)两者都含有SSR标记。

结论

在本研究中,基于响应冷应力差异表达的序列开发了一系列SSR标记。这些EST-SSR标记对于基因测绘和人口结构分析特别有用油棕.同时,EST-SSR位点在低温条件下可诱导表达,在油棕榈性状相关标记鉴定中具有潜在的应用价值。

背景

油棕(油棕雅克,2n = 32),属于油棕属槟榔科(棕榈科)是一种重要的热带油料作物。属油棕属由两种不同的物种组成,油棕(非洲油棕)和美洲油棕(美国油棕)[1].油棕目前在热带地区商业栽培,特别是在印度尼西亚和马来西亚的棕榈油生产。已经努力将非洲油棕引入区域审判种植园的亚热带地区,包括位于中国南部的海南省。然而,这些区域中的冬季温度通常低于20°C(并且甚至可以低于10°C),导致花芽分化和果实发育的放缓,随后严重影响油棕榈果生产率。因此,在这种热带物种中提高耐寒性是生产适合这些亚热带地区的非洲油棕榈基因型的主要育种目标。

微卫星(simple sequence repeats,SSRs)是每单位1-6个核苷酸的DNA串联重复序列,主要存在于真核生物基因组的非编码区。由于非编码区的选择压力较低,非编码ssr往往具有高度的多态性和共显性,易于检测。非编码ssr在遗传多样性和群体结构分析、连锁图谱构建、数量性状位点检测等方面有着广泛的应用[2] - [5.].然而,位于编码区和非翻译区的SSRs(转录的SSRs)可以成为基因区有效的功能标记[6.].编码区的SSR变化可以直接导致功能性蛋白质变化,而在5'未翻译区域(5'-UTR)中发生的SSR可以影响转录和翻译,3'-UTR中的SSR可以影响拼接[7.].因此,来自转录序列的SSRs可能与表型变异直接相关,从而成为功能性状标记。

AFLPs、rapd和AFLPs等分子标记已广泛应用于水稻遗传多样性和群体结构分析、性状相关标记的鉴定和基因型鉴定油棕[8.] - [11].最近,对转录组测序的使用越来越感兴趣以了解控制重要农艺性状的分子机制油棕[12].因此,释放大量表达的序列标签(EST)。显然,该序列信息包括用于识别基因相关的SSR标记的有价值的资源油棕. 以前,EST SSRs在油棕基于这一发布的数据已经由三项研究提供。在这三项研究中,低等人。[13]报道鉴定与组织培养有关的648个EST-SSR,而另外两项研究报告了与特定农艺特征无关的EST-SSR [14],[15].

在这里,我们报道了我们对从表达的序列衍生的EST-SSR的开发和表征响应于冷应力而下调至少两倍。我们的研究包括五个部分:(1)所获得的推定SSR的频率和分布的表征油棕转录组数据,(2)来自表达序列的EST-SSR标记的多态性分析在冷应激反应中上调或下调至少两倍,(3)硅片这些多态性标记的定位,(4)评估这些多态性标记与冷胁迫相关候选基因之间的物理距离,(5)利用与冷胁迫相关候选基因连锁的SSR标记探索192个油棕品系的群体结构。本研究开发的SSR标记将有助于遗传图谱的建立和群体遗传学的研究,并为低温胁迫的遗传改良提供候选标记油棕

方法

植物材料

油棕的品种,杜拉(非洲厚壳油棕)和Pisifera(非洲薄壳油棕)在20世纪90年代从马来西亚推出到中国,随后交叉以产生大量的F.1混血儿。种植试验表明,少量的F1杂交种可以适应位于中国南部的海南省冬季低温。选择的F1杂交幼苗如下:F.1杂交苗在苗圃里生长。选择同一苗圃、同一周萌发的21株1年生杂种F1代植株进行冷处理。在冷处理之前,将杂交苗置于26℃的生长室中一天。随后,从三个单独的复制品(作为对照品)中收集矛叶样品用于RNA提取。其余6组3个苗木复制品分别在8℃下放置0.5h、1h、4h、8h、1d和7d后取样。从对照和冷处理的幼苗中取样,并立即在液氮中冷冻。根据Xiao等人描述的MRIP方法,从对照和冷处理样品中提取总RNA[16].从对照样品和冷处理样品中的mRNA混合物以相等的illumina测序制备。

此外,从中国南部的海南省(44个)和马来西亚(148个)收集了192个油棕榈品系。在从马来西亚采集的油棕个体中,有34个是通过选择F1植物,显示对海南省低冬季气温的适应。最近将其他114个油棕榈个体引入中国,其中29也从F的自粉体产生1植物之间的杜拉Pisifera剩下的系的谱系都是未知的。采用mini-CTAB法从192株油棕幼叶中提取DNA[17].

Illumina测序和De Novo集装箱

从对照样品中分离的纯化mRNA和从冷处理混合物分别在增加的温度下分别用二价阳离子分离。将这些短片段作为模板,用于使用六甲醚引物和Superscript™III(Invitrogen TM,Carlsbad,Ca,USA)合成第一链cDNA。然后在含有缓冲液,DNTP,RNA族和DNA聚合酶I的溶液中合成第二链cDNA,随后使用Qiaquick PCR提取试剂盒(QIAGEN)纯化。EB缓冲器用于解决这些短片段以进行结束拒绝和聚(a)添加。将序列适配器连接到短cDNA序列的两端,并选择基于商机凝胶电泳结果的PCR扩增选择适当大小的cDNA片段。最后,使用Illumina Hiseq™2000对图书馆进行测序。根据配对末端样品制备试剂盒(Illumina,USA)开发了配对终端图书馆。转录组短读数是从头由Grabherr等人记录的协议后组装软件。[18].

转录组数据的功能注释

转录序列与NR数据库的E值阈值为10−5.(E)价值观 < 0.00001). 随后,用BLASTX将转录物序列与蛋白质数据库进行比对,包括Swiss-Prot、KEGG和COG。如果不同数据库的比对结果有冲突,则优先使用NR而不是Swiss prot的BLAST结果。应用WEGO软件对转录组进行GO功能分类[19].GO注释的结果也用于Kegg和Cog分析。

基因差异表达的计算

RPKM(Reads per kb per Million Reads)用于计算基因表达水平。根据Audic和Claverie记录的方法确定差异表达的统计学意义[20]. 当进行成千上万的假设检验时P-Value适用于单一测试是不足以保证低误发现的低速率。因此,使用多个假设测试来施加FDR(假发现率)控制方法以校正P-价值结果[21]. 随后,用RPKM比值同时计算每对样本的基因表达倍数变化。用FDR阈值筛选差异表达基因 ≤ 0.001和log的绝对值2比率 ≥ 1 [22].

假定ssr的鉴定和引物设计

Msatfinder软件用于识别假定的SSRs,其截止标准分别为12、8、5、5、5和5个重复的单、二、三、四、五和六核苷酸基序(http://www.bioinformatics.org/ftp/pub/msatfinder/). 随后,利用引物3软件设计了ssr侧翼引物[23].使用该软件,为这些SSR序列设计了3952个引物对(在附加文件中列出的信息1).为了评估与冷应激的响应相关的SSR中的多态性,使用低温诱导或抑制的表达序列中的侧翼SSR的引物用于扩增从24 f中分离的DNA2油棕榈植物。

PCR扩增与电泳

在含有100ng基因组DNA的10μl反应混合物中进行PCR扩增 × PCR缓冲液,25 mMMgCl21 U TaqDNA聚合酶(豆类,中国),0.5μM的每个引物和0.2毫米核苷酸混合,用以下计划:变性5分钟在94°C, 35 94°C的周期为30秒,30秒54.7°C和30秒72°C的伸长,最后7分钟的延伸在72°C。PCR产物在1%聚丙烯酰胺变性凝胶上电泳分离,银染色观察。产品大小是通过与100 bp DNA阶梯的比较来确定的。

设计标记的多样性分析及染色体定位

使用PIC计算器计算多态信息内容(PIC值)(http://www.liv.ac.uk/~kempsj/pic.html.) [24].使用BLAST算法,多晶型标记的染色体位置如下测定:首先,用于为多晶型标记物设计引物的表达序列被抑制油棕色斑曲序列(BioprojectID:192219:Prjna192219油棕);其次,根据Singh等人公布的基因组信息,进一步确定匹配contigs的染色体位置[25].

人口结构

运用贝叶斯聚类分析软件structure [26].执行十个独立的计算K值(K从1到11)。每次运行时,烧入时间长度和复制数都设置为100000。采用最大似然法将油棕品系划分为一个聚类,并将聚类的截止概率设为0.6。最可能的真实人口数(K)是通过绘图来确定的KK值为1到10,每K重复一次,对应于K图形。

结果

冷胁迫下油棕转录组中基于基因的ssr的频率和分布

在我们的研究(数据未发表)中,共获得了51452个平均长度为703 bp的油棕榈转录组应对寒冷胁迫的转录本。这些转录组数据在NCBI网站的TSA (transcriptome Shotgun Assembly)数据库中(Submission Number: GBSV00000000)。Msatfinder在5034个转录序列中鉴定出5791个SSR位点(附加文件1).在10(5034/51452)中近一个转录序列包含至少一个SSR基因座(表1).在基于我们的截止标准鉴定的这些微卫星中,三核苷酸基序类型最丰富(2821,48.71%)。单核苷酸基序包括下一大比例(1741,30.06%),然后是二核苷酸基序(1124,19.41%),具有少数四核苷酸(73,1.26%),五核苷酸(21,0.36%)和六核苷酸基序(11,0.2%)。

表格15791个ssr的特征分析油棕

在51452份转录本中,10973份在冷应激下上调或下调至少2倍。10973个转录本包含916个SSR位点。在51452个转录本中鉴定的所有SSR位点和916个与冷应激反应相关的SSR位点之间,观察到微卫星基序类型的相同分布(图1)1).在响应冷应力相关的SSR基因座的情况下,三核苷酸基序类型是最丰富(42.58%),其次是单核苷酸(34.61%)和二核苷酸(20.52%)基序类型。

图1
图1

基于所有转录序列和冷处理后差异表达的转录序列的单核苷酸到六核苷酸微卫星基序重复的分布。

进行比较分析以确定总SSR和冷反应SSR在转录序列中的位置(图1)2). 总ssr和冷反应ssr均主要发生在UTR区。其中单重复1570个(占单核苷酸总量的90.02%),双重复1020个(占双核苷酸总量的90.75%),三重复2033个(占三核苷酸总量的79.26%),四重复63个(占三核苷酸总量的91.3%),在表达的转录物的非翻译区(utr)中有21个五重复(占总五核苷酸的100%)和11个六重复(占总六核苷酸的100%)。值得注意的是,大部分的三核苷酸重复序列(532,20.74%)出现在表达转录物的编码序列(CDSs)中。与总ssr相比,冷反应ssr在表达的转录本中的分布基本一致。然而,在冷反应ssr中,相对较大比例的四核苷酸(2,25%)基序ssr位于表达转录物的编码序列(cds)中。

图2.
图2

非洲油棕中单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重复序列在总ssr和冷反应相关ssr的utr和外显子区域之间的百分比分布。

京都基因和基因组(Kegg)含有含SSR的转录物的途径响应于冷应激的基因和基因组(Kegg)途径

鉴于冷应激差异调节的含SSR的转录物的注释显示,这些转录物在不同的Kegg途径之间不均匀分布(图3.).在响应于冷应激差异调节的159个含SSR的转录物中,可以分配至少一个KEGG途径,将含SSR的转录物(58,36.48%)的最大比例分类为代谢途径(途径ID:KO01100).植物激素信号转导(途径ID:KO04075)包括下一个最大比例(9,5.66%),其次是植物病原体相互作用(8,5.03%;途径ID:KO03013),氧化磷酸化(6,3.77%;途径ID:KO00190),Cutin,Suberine和Wax生物合成(6,3.77%;途径ID:KO00073)和ABC运输扣(6,3.77%;途径:KO02010),单一转录物与植物新陈代谢相关,脂肪酸代谢,磷酸肌醇肌醇代谢,过氧化物酶体,蛋白酶体和RNA聚合酶。

图3.
图3

含ssr转录本的KEGG注释在油棕对冷应激反应中有差异调控。

冷反应相关SSR标记的多态性与小麦染色体位置油棕

从冷反应相关的单核苷酸到六核苷酸SSR重复序列的侧翼序列中,共成功设计了442对引物。不能为剩余的ssr设计引物对,主要是因为难以从已鉴定的微卫星的两侧获得足够的侧翼序列。随后,合成了442对引物序列,包括132个单核苷酸重复序列、74个双核苷酸重复序列、219个三核苷酸重复序列、7个四核苷酸重复序列、7个五核苷酸重复序列和3个六核苷酸重复序列,以检测24个油棕品系冷反应SSR的多态性程度。在278例(62.9%)的病例中,PCR产物可以从基因组DNA中扩增出来。其余164对引物由于缺乏PCR产物或扩增较弱而被排除在进一步分析之外。91对引物在所有品系中均扩增出单态条带。共鉴定出182个(41.2%)多态性微卫星标记(图1)4.),包括50个单核苷酸重复、22个二核苷酸重复、102个三核苷酸重复、4个四核苷酸重复、2个五核苷酸重复和1个六核苷酸重复。单核苷酸、二核苷酸、三核苷酸和四核苷酸多态重复序列的比例分别为38%、30%、47%和57%。从182个位点中鉴定出402个微卫星等位基因,平均每个位点有2.2个等位基因。402个等位基因中,105个来自单核苷酸基序位点,平均每个位点2个等位基因;46个来自二核苷酸基序位点,平均每个位点2个等位基因;227个来自三核苷酸基序位点,平均每个位点2.2个等位基因。182个多态性标记的PIC值为0.08 ~ 0.65(均值为0.31±0.12),表明所开发的冷反应相关SSR标记具有中等水平的多态性(图)5.).50个单核苷酸重复序列、22个二核苷酸重复序列和102个三核苷酸重复序列的平均PICs分别为0.30、0.31和0.31。182多态标记的详细信息在附加文件中列出1

图4.
图4

4个SSR标记的PCR产物及多态性特征油棕加入。

图5.
图5

分析了非洲油棕中单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸SSR位点的PIC值分布。

基于硅片在182个已开发的基于基因的SSR标记中,有137个(75.3%)可以放在计算机上油棕染色体(图6.). 每个染色体的SSR标记数从3个(9号染色体)到20个(5号染色体)不等,16条染色体上平均每个染色体有8.52个SSR标记。相邻SSR标记间的物理距离为96bp~20.8mbp,总覆盖长度为473.4mbp,平均物理长度为3.5mbp。有关相邻标记之间物理距离的详细信息已在附加文件中列出2

图6.
图6

基于转录组序列开发的基于基因的ssr的染色体位置在冷应激反应中差异表达。染色体由一系列组装的支架组成。每个脚手架都用一个柱表示。列的长度对应于脚手架的长度:1厘米代表10000kb。左边的数字“KE......”代表脚手架ID号来自油棕NCBI数据库中的基因组。括号内的数表示SSR标记的观察杂合度。

低温胁迫应答的候选基因的鉴定以及这些候选基因与SSR标记的物理距离

对寒冷胁迫下转录组的比较分析显示,10973个转录组在寒冷胁迫下表达上调或下调至少两倍。在这些应答寒冷胁迫的转录本中,有一些被注释为先前研究中记录的抗寒基因。根据注释结果,是8CBF公司orthologs,二ICE1.正射影像,三尺寸1orthologs,二ZAT10型orthologs,一hos1.Orthlogs和一体MYB15在CBF介导的冷信号转导过程中,检测到了一些关键的转录因子。其中,6个转录本(35.3%)至少上调了2倍,其中包括Unigene21287(ICE1.,4.49折),cl4558.contig1(CBF公司,6.14折),cl4552.contig2(CBF公司,11.08折),cl83.contig2(CBF公司,5.44折),cl83.contig3(CBF公司,7.1倍)和Unigene 26961(CBF公司,11.9倍)。有趣的是,候选单基因21287的5′非翻译区(ICE1.(4.49倍)的24个品系中含有一个多样性程度较高(PIC值为0.619)的SSR位点(Unigene21287×ussr)油棕.同时,基于硅片另外5个候选基因中的3个位于含有SSR标记的基因组支架上。三个候选标记与相邻SSR标记之间的物理距离在附加文件中列出3.

此外,一些成绩单被归类为南汽根据COG注释结果的转录因子,其中一些成员被记录在某些物种中与耐寒耐受性有关。在油棕,19(41.3%)46南汽转录因子在冷应激下上调至少两倍,折叠变化从2.16倍(Unigene7160)到10.32倍(Unigene22381)。其中,CL2628的5'未翻译区域.contig1(南汽,上调的2.82倍)还包含一个具有中等多态性的SSR制造商(PIC值:0.275),横跨24行油棕.其他18个候选人中的14个南汽转录因子也被定位在含有SSR标记的基因组支架上。15个候选标记和相邻SSR标记之间的物理距离在附加文件中列出4.

同时,根据之前在其他物种中冷诱导表达的文献注释结果,36个转录本在功能上被归类为假定冷诱导的假定同源。然而,在油棕,在低温下,仅需四个(10.8%)的37种转录物,包括CL3095.Contig2(冷诱导蛋白,3.67倍),Cl384.contig1(冷诱导蛋白,2.89倍),CL2052.contig2(冷诱导蛋白,3.75倍)和Cl559.contig2(冷诱导蛋白,2.54)。在四个候选者中,三个位于含有SSR标记的基因组支架上。三个候选者和其相邻的SSR标记之间的物理距离在附加文件中列出5.

利用10个与候选基因连锁的SSR标记研究192个油棕品系的群体结构

10个SSR标记(3个与候选基因紧密连锁,7个与候选基因不紧密连锁,包括Unigene21287\U SSR、Unigene25696\U SSR、CL2628\U Contig1\U SSR、Unigene19403\U SSR、Unigene30741\U SSR、CL14\U Contig1\U SSR、Unigene3598\U SSR、CL2490\U Contig3\U SSR、Unigene32985\U SSR、,利用CL4880(Contig2)和SSR对来自马来西亚和中国的192个油棕个体进行基因分型。其中油棕34个品系是从F2源自所选F的自我授粉的人口1从海南省位于中国南部的海南省收集了对海南省和44家的低冬季气温的混合动力。最近从马来西亚收集其他油棕榈个体,这没有对耐寒耐性的选择。Evanno的方法et al。[27]为了确定192个油棕品系中最可能的“真实种群”数量,推断出两个遗传群(图1)7.).结构分析表明,具有一定冷适应能力的油棕线与不具有冷适应能力的油棕线之间存在部分分离。几乎所有F2由所选F的自粉体产生的个人1植株全部聚为红色亚群(图7.). 然而,从海南省采集的油棕品系在这两个亚群中都有发现:大约有一半(26个)属于红色亚群。这些油棕品系也可能起源于东南亚,并在20世纪初传入中国。由于对海南省气候环境的不适应,引进的油棕品系几乎全部表现出低产性。随后,这些油棕品系大部分被砍伐,剩下的油棕品系仅用作造林树种。因此,海南油棕品系没有广泛的人工选择,只有一半能与F2个人。从马来西亚收集的大部分油棕榈泥线被分组到黄色子群中(图7.). 油棕榈品系是最近从马来西亚引进的,没有经过适应海南气候环境的筛选。因此,相对于F2个体,这些油棕品系可以分为另一个亚群。总之,这些与候选基因连锁的标记可以部分区分油棕对海南省冬季低温的适应和不适应,提示这些标记可能与低温胁迫有关。

图7.
图7

中国南部海南省和马来西亚192个油棕品系的种群结构。

讨论

油棕具有最高的任何作物物种的油产量,以及包含最富有的饮食源A的富肽A [28].目前,这种作物只能在热带国家培养。一些努力已经介绍油棕进入全球亚热带地区,例如云南和中国海南省。然而,这些亚热带区域的低冬季温度对肉体果实生产率的严重影响油棕.为了促进这一重要作物品种抗寒性的提高,我们的目的是开发与抗寒性相关的分子标记油棕. 在这项研究中,我们开发了182个多态性EST-SSR标记的基础上差异表达的序列对冷应激的反应。这些EST-SSR标记的PIC值范围为0.08~0.65(平均值) = 0.31 ± 0.12). 同时,基于硅片通过作图,将EST-SSR标记分别定位在16个标记上油棕染色体。然后,计算开发的EST-SSR标记与推测的冷胁迫相关基因之间的物理距离。因此,基于冷胁迫反应差异表达序列开发的EST-SSR标记在抗寒性分子育种中具有潜在的应用价值油棕

在以往的研究中,EST-SSRs一般是通过测序来确定的油棕cDNA图书馆。与Illumina测序相比,cDNA文库的测序产生非常有限的表达序列数据。Tranbarger等人。[14]从6103个非冗余EST序列中鉴定出465个EST-ssr,这些EST序列来源于发育中的营养组织和生殖组织的cDNA文库油棕.其中,只能设计289个底漆对EST-SSRS。低等。[13]从12个标准cDNA文库的9584个表达序列标签中,鉴定出648个非冗余EST-SSRs,代表油棕榈组织培养的三个主要发育阶段。Ting等人[15]从10258个独特序列中识别722个SSR。在这项研究中,我们确定了总共5,791个SSR,比以往研究中确定的数量相当更大。同时,设计了3952个引物对为这些SSR序列设计,远远超过先前研究中开发的SSR对的数量油棕[13] - [15]. 在这些引物对中,我们重点研究了442对与表达序列相对应的引物对,它们在冷胁迫下被诱导或抑制至少两倍。

根据单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸SSR的12个、8个、5个、5个和5个重复的截止标准,三核苷酸是最丰富的EST-SSR标记。这一结果与以往发现的三核苷酸基序是人类最常见的EST-SSR基序是一致的Cocos Nucifera.[29]. 然而,在其他一些物种中,最丰富的基序是二核苷酸[30],这可能是确定SSR的松散截止标准的结果。为了比较ssr的总密度油棕与其他植物中报道的转录组相比,我们使用与Cardle等人相同的截止标准重新计算SSR[31],二、三、四和五分别有7、5、4和4个重复。共鉴定出4794个SSR,每7.53kb有一个SSR。SSR密度油棕类似于椰子棕榈(每7.59 kB的一个SSR)和大豆(每7.4 kB的一个SSR)[29],[32]但高于玉米(每8.1 kB),番茄(每11.1 kB),拟南芥(每13.83 kB),杨树(每14 kB一次)和棉花(每20 kb,每20 kB一度)。此外,在蓖麻籽中发现了较高的SSR密度比油棕(每1.77 kB为单SSR)[33],[34].

一些研究表明,ssr主要位于表达序列的UTR区域,尤其是单核苷酸、二核苷酸、四核苷酸、五核苷酸和六核苷酸序列[35.].显然,如果SSR(单核苷酸、二核苷酸、四核苷酸、五核苷酸和六核苷酸基序)位于编码区,则SSR序列的突变将导致编码框架的变异,导致有害突变。然而,在椰子和蓖麻的编码区域内发现了较高比例的三核苷酸基序,这可能是由于三核苷酸基序的拷贝数突变不会导致帧移突变。在本研究中,我们还观察到在UTR区域有很高比例的single -(97.09%)、di-(97.05%)、tetra-(91.3%)、penta-(100%)和hexa-nucleotide (100%) SSRs。然而,对于三核苷酸基元SSRs,只有20.7%位于编码区,远低于椰子树(53.6%)[29]蓖麻(76.1%)[35.]. 编码区的ssr频率较低,说明编码区变异较小,易发生突变油棕

基于NCBI数据库中可用的表达序列鉴定推测的SSR已经进行过。然而,这些推测的ssr多态性的程度在以前的研究中没有被描述[13] - [15]. 在我们的研究中,我们设计了3952对引物,它们位于相应表达序列的两侧油棕. 在3952对引物中,有442对引物侧翼的表达序列在冷胁迫下受到差异调控,被用来对24个水稻品系进行基因分型油棕. 共有182个SSR位点具有多态性,其PIC值在0.08~0.65之间,平均为0.31。在我们的研究中开发的冷反应SSR标记似乎与其他物种中报道的EST-SSR具有相对相似的多样性水平[35.],[36.].然而,这些SSR标记的多样性低于以前在其他棕榈物种中记录的基因组SSR标记[37.].这可以解释为从表达序列中获得的SSRs由于其存在于功能基因中而经受着选择压力来对抗突变。

虽然大量的研究报告了各种植物物种中EST-SSR标记的开发,但这些发育的SSR标记的染色体位置通常缺乏,这对于随后的联系不平衡,关联分析和分子育种的研究是不利的。在我们研究中,137名(75.3%)的182个标记的开发是位于16个染色体上油棕基于硅片为后续的遗传育种研究提供基础信息。此外,植物对低温的反应是一个非常复杂的生物过程,需要整合大量的功能基因来抵御低温胁迫。CBF级联在不同植物物种的冷驯化中起着重要作用。CBF级联涉及一系列转录因子,包括ICE1.hos1.MYB15尺寸1ZAT10型,传输冷信号并随后启动对冷应力的立即响应[38.]. 在本研究中,八CBF公司orthologs,二ICE1.正射影像,三尺寸1orthologs,二ZAT10型orthologs,一hos1.Orthlogs和一体MYB15Orthologs也被检测到油棕转录om响应于低温。就像其他物种一样,推定ICE1.CBF公司矫形学也被强烈诱导油棕承受着寒冷的压力。两个SSR制造商分别与一个ICE1.候选基因(Unigene21287,上调4.49倍)和CBF公司候选(CL83.Contig3,7.1倍):一个SSR标记位于该基因的5′非翻译区ICE1.候选人和另一个SSR标记只有12.6 kBCBF公司候选人。这两个候选的SSR标记将有助于水稻抗寒性的分子育种油棕. 与此同时,许多证据也表明南汽基因在非生物和生物胁迫反应中也起着重要作用[39.]. 在这项研究中,46个假设南汽同源性预测,其中19个基因表达上调至少2倍。在南汽低温诱导的候选者,一个SSR标记似乎与两个密切相关南汽候选人(cl4107.contig2和cl2628.contig1):位于5'未转换的区域中南汽候选者(CL4107.Contig2),与CBF候选者只有79.8kb的物理距离。这种与冷胁迫诱导的候选基因紧密连锁的SSR标记可以进一步验证,为以后的关联分析奠定基础油棕

此外,使用十个SSR标记(三个与候选基因与候选基因密切相关的三个与候选基因密切相关)分析192个油棕榈脂的人口结构。有趣的是,这些标志可以部分地区分历史地改善海南省气候环境的油棕榈线和没有的油掌。然而,结构结果没有得出结论这些标记和冷应激之间的关系。将来,将研究192个油棕榈线的耐寒性的表型数据。如果这些标志物预测油棕的耐寒性,可以进一步验证表型冷应激的表型变异与候选基因的SSR标记之间的关联分析。

结论

基于基因的SSR可以直接影响表型,并且还与对应于感兴趣的特征的编码或调节区域的遗传变异密切相关。在该研究中,基于基于转录组数据确定了总共5,791个SSR基因座油棕与对照(对照生长条件)RNA样本和冷处理混合RNA样本分开。在这5791个基于基因的ssr中,有916个来自表达序列在寒冷胁迫下上调或下调至少两倍。根据冷反应ssr引物侧翼序列,设计442对引物,对24个ssr引物进行基因型分析油棕.PCR扩增产物为182个引物对在24条线之间显示多态性。这些多晶型标志物随后用于分析遗传多样性和人口结构,鉴定具有相关标志物和基因型表征的鉴定油棕.同时,将137个SSR标记定位于16个不同的染色体上油棕使用硅基测绘,这将为重要的农艺性状的位置提供基本信息,以及联系不平衡分析油棕. 此外,差异表达分析显示ICE1.推定的直播,五CBF公司假定直系同源,19南汽转录因子和四个冷诱导的orhologs在冷胁迫下至少上调两倍。其中,有22名候选人可能被选中硅片映射到含有SSR标记的基因组支架上,其中三个SSR标记与一个密切相关ICE1.候选人,aCBF公司候选人和两个南汽候选人。这三个候选的SSR标记可直接应用于水稻耐冷性的分子育种油棕

附加文件

工具书类

  1. 1.

    Corley RHV,Tinker PB:油棕。第四版。牛津:英国布莱克威尔科学;2003

    谷歌学术

  2. 2.

    邱D,摩根C J,长Y,刘J,李R,壮族X, Y,谭X,迪特里希E, Weihmann T,埃弗雷特C, Vanstraelen年代,贝克特P,弗雷泽F,技巧,巴恩斯,威尔默J,施密特R,李,李D,孟J,班克罗夫特我:油菜比较连锁图及其用于籽油和芥酸含量的QTL分析。理论与应用,2006,114:67-80。10.1007 / s00122 - 006 - 0411 - 2。

    文章中科院PubMed.谷歌学术

  3. 3.

    夏W,肖Y,刘Z,罗Y,Mason AS,樊H,杨Y,赵S,彭M,等:基于基因的简单序列重复标记在椰子关联分析中的应用。分子育种2014年,34:525 - 535。

    文章中科院谷歌学术

  4. 4.

    肖勇,陈丽,邹杰,田娥,夏伟,孟杰:新型人口的发展芸苔属植物显著在两个A/C基因组上多样化。理论应用基因。2010,121:1141-1150.10.1007/s00122-010-1378-6。

    文章PubMed.谷歌学术

  5. 5。

    萧y,罗y,杨y,范h,夏w,梅森as,zhao s,sager r,fei问:微卫星标记的开发Cocos Nucifera.及其在评价植物遗传多样性水平中的应用Cocos Nucifera.. 植物组学。2013, 6: 193-200.

    谷歌学术

  6. 6。

    Li Y-C,Korol AB,Fahima T,Nevo E:基因内的微卫星:结构、功能和进化。分子生物学。2004年,21:991-1007.10.1093/molbev/msh073。

    文章中科院PubMed.谷歌学术

  7. 7。

    Lawson-MJ,Zhang-L:管家和组织特异性基因在5′-UTR区域的简单重复序列上存在差异。基因。2008,407:54-62.10.1016/j.gene.2007.09.017。

    文章中科院PubMed.谷歌学术

  8. 8。

    Billotte N、Marseillac N、Risterucci AM、Adon B、Brottier P、Baurens FC、Singh R、Herran A、Asmady H、Billot C:基于微卫星的油棕高密度连锁图谱(油棕雅克)。理论应用基因。2005,110:754-765.10.1007/s00122-004-1901-8。

    文章中科院PubMed.谷歌学术

  9. 9。

    Cochard B,Adon B,Rekima S,Billotte N,De Desmier Cr,Koutou A,Nouy B,Omore A,Purba Ar,Glazsmann JC:非洲油棕多样性的地理和遗传结构表明了新的繁殖方法。树遗传学基因组织。2009,5:493-504。10.1007 / s11295-009-0203-3。

    文章谷歌学术

  10. 10。

    Moretzsohn Mc,Nunes CDM,Ferreira Me,Grattapaglia D:油棕中壳体厚度轨迹的Rapd联动映射(Eleais Guineensis.jacq。)。Al Appl Genet。2000,100:63-70。10.1007 / S001220050009。

    文章中科院谷歌学术

  11. 11

    Rance KA,Mayes S,Price Z,Jack PL,Corley RHV:油棕产量构成的数量性状位点(油棕jacq。)。Al Appl Genet。2001,103:1302-1310。10.1007 / s122-001-8204-z。

    文章中科院谷歌学术

  12. 12

    Tranbarger TJ、Dussert S、Joët t、Argout X、Summo M、Champion A、Cros D、Omore A、Nouy B、Morcillo F:油棕果实中果皮成熟、成熟的调控机制,以及脂质和胡萝卜素油代谢的功能专门化。植物生理学。2011,156:564-584.10.1104/第111.175141页。

    pmed中央文章中科院PubMed.谷歌学术

  13. 13

    Low ET,别名H,Boon SH,Shariff EM,Tan CA,Ooi LC,Cheah SC,Raha AR,Wan KL,Singh R:油棕(Elaeis guineensis Jacq.)组织培养est:识别与胼胝体发生和胚胎发生相关的基因。BMC植物生物学。2008, 8: 62-10.1186/1471-2229-8-62.

    pmed中央文章PubMed.谷歌学术

  14. 14。

    Tranbarger TJ、Kluabmongkol W、Sangsrakru D、Morcillo F、Tregear JW、Tragoonrung S、Billotte N:与植物和生殖发育过程中转录后和转录调控功能相关的基因转录中的SSR标记油棕. BMC植物生物学。2012, 12: 1-10.1186/1471-2229-12-1.

    pmed中央文章中科院PubMed.谷歌学术

  15. 15.

    Ting NC,Zaki NM,ROSLI R,LOW ETL,ITHNIN M,Cheah SC,Tan SG,Singh R:SSR采矿在油棕地点数据库:在油棕种质种质研究中的应用。J Genet。2010,89:135-145。10.1007 / s12041-010-0053-7。

    文章PubMed.谷歌学术

  16. 16。

    肖勇,杨勇,曹华,范华,马志,雷×,Mason AS,夏×,黄×等:从热带棕榈中高效分离高质量RNA用于RNA序列分析。植物常规2012, 5:584–589.

    中科院谷歌学术

  17. 17。

    Stewart C,Via LE:一种用于RAPD指纹分析和其他PCR应用的快速CTAB DNA分离技术。生物技术。1993, 14: 748-750.

    中科院PubMed.谷歌学术

  18. 18。

    Grabherr Mg,Haas Bj,Yassour M,Levin JZ,Thompson Da,Amit I,Adiconis X,Fan L,Raychowdhury R,Zeng Q,Chen Z,Mauceli E,Hacohen N,Gnirke A,Rhind N,Palma F,Birren BW,Nusbaum c,lindblad-toh k,friedman n,Regev a等al:来自RNA-SEQ数据的全长转录组件,没有参考基因组。纳特生物技术公司2010,29:644-652。

    文章谷歌学术

  19. 19。

    Mortazavi A,Williams Ba,MCCue K,Schaeffer L,Wold B:通过RNA-SEQ进行映射和定量哺乳动物转录om。NAT方法。2008,5:621-628。10.1038 / nmeth.1226。

    文章中科院PubMed.谷歌学术

  20. 20。

    Audic S,Claverie JM:数字基因表达谱的重要性。Genome Res。1997年,7:986-995。

    中科院PubMed.谷歌学术

  21. 21。

    Peiner A,Yekutieli D,Benjamini Y:使用错误发现率控制程序识别差异表达基因。生物信息学。2003,19:368-375.10.1093/生物信息学/btf877。

    文章谷歌学术

  22. 22。

    吴杰,张勇,张宏,黄宏,Folta-KM,陆杰,等:应用solex测序技术对山葡萄霜霉病全基因组表达谱的研究。BMC植物BIOL.2010, 10:234.

    pmed中央文章PubMed.谷歌学术

  23. 23

    Rozen S,Skaletsky H:PRIMOR3关于一般用户和生物学家程序员的WWW。生物信息学方法和协议。1999年,春天,纽约,365-386。10.1385 / 1-59259-192-2:365。

    谷歌学术

  24. 24

    Cordeiro Gm,Taylor Go,Henry RJ:甘蔗渣微卫星标记的表征(Saccharum sp.),一种高度多倍体物种。植物SCI。2000,155:161-168。10.1016 / s0168-9452(00)00208-9。

    文章中科院PubMed.谷歌学术

  25. 25

    Singh R,Ong-Abdullah M,Low et,Manaf Ma,Rosli R,Nookiah R,Ooi Lc,Ooi Se,Chan Kl,Halim Ma,Azizi N,Nagappan J,Bacher B,Lakey N,Smith SW,他D,Hogan M,Bugiman Ma,Lee Ek,Desalle R,Kudrna D,Goicoechea JL,Wing Ra,Wilson RK,Fulton Rs,Ordway JM,Martienssen Ra,Sambanthamurthi R等,Sambanthamurthi R等:油棕基因组序列揭示了干扰物种的分歧和新世界。自然2013,500:335-339。

    pmed中央文章中科院PubMed.谷歌学术

  26. 26。

    陈建平,李建平,陈建平,等:基于多位点基因型数据的种群结构分析。遗传学报,2000,155:945-959。

    pmed中央中科院PubMed.谷歌学术

  27. 27。

    Evano G,Regnaut S,Goudet J:使用软件结构检测个体聚类数:一项模拟研究。摩尔经济。2005年,14:2611-2620.10.1111/j.1365-294X.2005.02553.x。

    文章中科院PubMed.谷歌学术

  28. 28。

    墨菲DJ:油棕榈:产量和质量改进的未来前景。脂质技术。2009,21:257-260.10.1002/lite.200900067。

    文章谷歌学术

  29. 29。

    夏W,肖Y,刘Z,罗Y,Mason AS,樊H,杨Y,赵S,彭M:基于基因的简单序列重复标记在中国人群中的应用Cocos Nucifera.. 分子育种。2014,34:525-535.10.1007/s11032-014-0055-x。

    文章中科院谷歌学术

  30. 30

    杜Q,Gong C,Pan W,张D:中国白杨树木质物质候选基因微卫星的开发与应用(Populus tomentosa卡尔)。DNA Res.2012,20:31-44.10.1093/dnares/dss031。

    pmed中央文章PubMed.谷歌学术

  31. 31

    Cardle L,Ramsay L,Milbourne D,Macaulay M,Marshall D,Waugh R:植物中物理聚集简单序列重复的计算和实验表征。遗传学。2000, 156: 847-854.

    pmed中央中科院PubMed.谷歌学术

  32. 32。

    利用est - ssr进行群体遗传分析。遗传,2007,99:125-132。10.1038 / sj.hdy.6801001。

    文章中科院PubMed.谷歌学术

  33. 33。

    Varshney Rk,Thiel T,Stein N,Langridge P,Graner A:在一些谷物种类中微卫星频率和分布的硅分析。细胞摩尔Biol Lett。2002,7:537-546。

    中科院PubMed.谷歌学术

  34. 34。

    Varshney Rk,Graner A,Sorrells Me:植物的基因微卫星标记:特征和应用。趋势生物技术。2005,23:48-55。10.1016 / J.TibTech.2004.11.005。

    文章中科院PubMed.谷歌学术

  35. 35

    邱玲,杨超,田斌,杨建斌,刘a:蓖麻EST- ssr标记的开发与应用。中国生物医学工程学报,2010,31(3):431 - 436。

    pmed中央文章中科院PubMed.谷歌学术

  36. 36

    Ramu P,Billot C,Rami JF,Senthilvel S,Upadhyaya HD,Reddy La,Hash CT:使用EST-SSR标记进行棘氏参考遗传多样性的评估。Al Appl Genet。2013,126:2051-2064。10.1007 / S00122-013-2117-6。

    文章中科院PubMed.谷歌学术

  37. 37

    Rivera R,Edwards KJ,Barker JHA,Arnold GM,Ayad G,Hodgkin T,Karp A:基因多态性微卫星的分离和鉴定Cocos Nucifera.L.基因组。1999年,42:668-675。10.1139 / g98-170。

    文章中科院PubMed.谷歌学术

  38. 38。

    Chinnusamy v,朱茹,朱JK:植物中基因表达的冷应力调节。趋势植物SCI。2007,12:444-451。10.1016 / J.Plants.2007.07.002。

    文章中科院PubMed.谷歌学术

  39. 39。

    Wang X,Basnayake BM,Zhang H,Li G,Li W,Virk N,Mengiste T,Song F:拟南芥ATAF1是一种NAC转录因子,是对坏死性真菌和细菌病原体防御反应的负调节因子。植物与微生物相互作用。2009年,22:1227-1238.10.1094/MPMI-22-10-1227。

    文章中科院PubMed.谷歌学术

下载参考资料

致谢

这项工作得到了中国自然科学基金(31101179号)、海南市重大科技项目(ZDZX2013023—1)、澳大利亚市研究理事会早期职业研究奖(DE120100 668)、海南省自然科学基金(313059)的资助。

作者信息

隶属关系

作者

通讯作者

对应到萧勇

附加信息

利益争夺

提交人声明他们没有竞争利益。

作者的贡献

YX进行DNA提取和随后的PCR扩增,参与研究设计,进行统计分析并起草手稿。LZ做了DNA提取、PCR扩增和电泳实验等主要实验工作,参与了统计分析并起草了稿件。WX参与数据分析并起草了手稿。他批判性地修改了手稿。YY对DNA扩增实验做出了贡献和建议,并参与了本研究的设计。MP参与并指导了DNA扩增实验,并提出了一些建议,ZM参与了本研究的设计。所有作者都阅读并批准了最后的手稿。

萧咏、周立霞对这项工作的贡献不相上下。

电子补充材料

12870 _2014_384_moesm1_esm.xlsx

附加文件1:3952 SSR引物的信息,包括引物序列,TM值,片段大小,基序,重复数,TM(退火温度),折叠变化,NA *(观察到的等位基因数),PIC(多态信息内容)和GeneBank accessions。(XLSX 523 KB)

附加文件2:同一染色体上相邻标记之间的物理距离。(XLSX 16 KB)

12870_2014_384_moesm3_esm.xlsx.

附加文件3:涉及cbf介导通路的标记和候选基因之间的物理距离。(XLSX 10 KB)

附加文件4:NAC系列SSR标记和候选基因之间的物理距离。(XLSX 10 KB)

12870\ 2014\ 384\ MOESM5\ ESM.xlsx

附加文件5:SSR标记与候选基因之间的物理距离,涉及冷诱导和冷休克。(XLSX 10 KB)

作者的原始提交的图像文件

权利和权限

本文经BioMed Central Ltd.许可发布。这是一篇根据知识共享署名许可条款发布的开放获取文章(http://creativecommons.org/licenses/by/4.0.)允许在任何媒介中不受限制地使用、分发和复制,前提是原作被适当地记入贷方。知识共享公共领域放弃(http://creativecommons.org/publicdomain/zero/1.0/)适用于本条提供的数据,除非另有说明。

重印和权限

关于这篇文章

通过Crossmark验证货币和真实性

引用本文

肖勇,周磊,夏伟。et al。利用转录组数据的开发和表征基于基于基于SSR标记的油棕榈耐寒性耐寒性标记物(油棕).BMC植物BIOL.14,384(2014)。https://doi.org/10.1186/s12870-014-0384-2

下载引用

关键字

  • 冷应力
  • 耐寒性
  • 多态信息含量
  • 海南省
  • Elaeis Guineensis.