跳过主要内容

选择效应和三个蓝莓品种全基因组倍增(WGD)事件的分子足迹:由转录组数据集检测

摘要

背景

无论选择效应和全基因组倍增的植物物种和发展中扮演了非常重要的作用,并破译了相应的分子足迹一直是遗传学家的中心任务。Vaccinium是种属丰富是由约450种,蓝莓是最重要的品种之一Vaccinium属植物,因其高健康价值而广受欢迎。本文旨在破译蓝莓物种进化史上单拷贝基因上的自然选择分子足迹和WGD事件。

结果

从19个兔眼蓝莓品种(T1)、13个南方高丛蓝莓品种(T2)和22个北方高丛蓝莓品种(T3)叶片转录组组装的45,535、42,914和43,630条ungenes中,分别鉴定出30,143、29,922和28,891条推测的蛋白编码序列。共发现17、21和27个单拷贝同源基因分别在T1与T2、T1与T3、T2与T3中发生阳性选择,这些同源基因富集于“萜类骨干生物合成”、“缬氨酸、亮氨酸和异亮氨酸生物合成”、“丁酸代谢”等代谢通路中。“c5 -支链二元酸的代谢”“泛酸和辅酶a的生物合成”。我们还检测到发生在三个蓝莓物种进化史上的最近(约9.04 MYA)、中(约43.44 MYA)和古老(约116.39 MYA) WGD事件的显著分子足迹。

结论

蓝莓中一些重要的功能基因表现出正向选择效应。在蓝莓物种的进化史上,至少检测到3轮WGD事件。我们的工作为蓝莓的适应进化和物种辐射的遗传机制提供了深刻的见解Vaccinium在短的地质尺度时间内。

背景

突变-选择过程是进化最基本的机制,突变是自然选择作用的来源,最终自然选择导致等位基因(突变)频率的优化过程[1].识别受自然选择影响的等位基因或基因使遗传学家着迷了很长一段时间。2,3.].到目前为止,已经引入了十多种统计方法来检测导致自然选择的分子足迹[4,5].其中,Ka/Ks比值法(Ka:每个非同义位点的非同义替换数,Ks:每个同义位点的同义核苷酸替换的数量)对估计选择压力和理解密切相关但却存在分歧的物种的蛋白质编码序列的进化动态有很大的影响[6,7,8].

全基因组复制(WGD)或多倍体事件是另一种进化遗传现象,它在物种形成和进化中具有重要意义,长期以来一直吸引着遗传学家[9,10,11,12].例如,WGD事件是许多植物谱系物种辐射的重要力量[13,14,15,16,17].根据年龄和细胞遗传学和染色体核型的结果,WGD事件可分为两类,一类是近期的或新的多倍体事件,这导致了“同源多倍体”,并从非减数分裂,或杂交所产生的配子的融合出现从种间杂交产生的相同物种的个体的正常减数分裂配子,或“异源多倍体” [18].大约47-70%的被子植物被估计为多倍体,大约25%的维管植物经历了近期的多倍体化[19,20.],该WGD事件可通过核型分析和流式细胞术检测[21].另一个是发生在早期地质时代的古代多倍体事件。我们认为所有现存的被子植物都是古多倍体,在它们的进化史上都经历了两次或更多的古代多倍体事件[22,23].尽管随后发生了二倍体化(大量基因丢失和结构重排)或分裂事件,使多倍体恢复到二倍体状态,但古老的WGD足迹仍会以复制基因块的形式出现在基因组序列中[24,25].

下一代测序技术产生的高通量基因组数据正频繁用于研究进化遗传学的关键问题[26,27,28].然而,对于一些基因组多倍体、杂合度高或基因组GC含量高的非模式物种,全基因组测序仍不可行。在这种情况下,转录组测序提供了理想的选择,具有测序成本高、信息丰富、编码蛋白、功能预测、无物种或个体限制等优点[29,30.,31].近年来,转录组测序被广泛用于检测进化研究的分子足迹,包括选择效应和WGD [32,33,34,35,36].

Vaccinium是杜鹃花科中一个年轻而分布广泛的属,约有450种[37,38].的种数Vaccinium属远远超过属级植物(约67个属)和杜鹃花科植物(约80个属)的平均物种数(http://www.theplantlist.org/statistics/).显然,Vaccinium品种经历了近期和辐射演化。在近几十年来,Vaccinium由于许多品种(如蓝莓、蔓越莓、越桔和越橘)的果实中富含抗氧化剂,具有营养和治疗作用,因而越来越受到人们的关注[39蓝莓是我国最重要的植物群之一Vaccinium,由约20个品种组成[38].除6个二倍体种外,所有蓝莓种均为多倍体,有的具有复杂的多倍体基因组,如Vaccinium corymbosum40].尽管蓝莓的驯化和栽培只有一个世纪的历史,但蓝莓已被列为北美经济上最重要的五大非柑橘类水果[41,42]蓝莓受欢迎的主要原因是其优良的饮食治疗功能,这是由水果中的高花青素含量产生的[30.,43,44,45]目前商业种植的蓝莓品种主要来自二倍体矮丛蓝莓(诉myrtilloides)、四倍体矮丛蓝莓(诉angustifolium),北方四倍体高丛蓝莓(诉corymbosum),六倍体兔眼蓝莓(诉virgatum),南部丛蓝莓(混合自诉corymbosum L×南方本地种)和半高丛蓝莓(杂交诉corymbosum×诉angustifolium)[46,47].其中,兔眼蓝莓、北方高丛蓝莓和南方高丛蓝莓在商业水平上被广泛种植。

到目前为止,和许多重要作物一样,蓝莓研究也进入了基因组时代。例如,一种北方高丛蓝莓的基因组草图已经发表[48,49].转录组分析已被用于研究蓝莓在寒冷环境中的基因表达特征[50,51,52],蓝莓抗氧化物质的代谢相关基因[53]蓝莓感染病毒后基因表达谱的变化炭疽菌acutatum54]蓝莓果实5个发育阶段的基因表达动态[48],和检测分子标记的[55].然而,关于蓝莓的基因组进化的报告是有限的。在本文中,我们分析了组装转录数据,将其从第二代测序平台产生,并且一个主要目的是:(1)重新构造中54个蓝莓品种的亲缘关系,(2)鉴定的基因经历选择效应,(3),并检测在蓝莓的进化史的WGD事件,并在约进化辐射的遗传机制提供深入了解Vaccinium物种。

结果

蛋白编码单基因综述

从45535年rabbiteye组装unigenes蓝莓(T1)、42914年南部高丛蓝莓(T2)和43630年在北高丛蓝莓(T3)物种,我们确定了30143年,29922年和28891年蛋白质编码unigenes根据Nr的注释,Swiss-Prot,去和KEGG数据库,并利用程序三个蓝莓ESTScan物种,分别(表1).

表1从3个蓝莓品种54个品种的总转录本中检测到的蛋白编码ungenes数量

基因家族的统计数据

我们从三个蓝莓转录组的蛋白编码基因中检测到45171个基因家族。其中,有14882个基因家族,包括52780个ungenes,被所有三个蓝莓转录组共享。兔眼蓝莓与南方高丛蓝莓共有1643个基因家系,其中ungenes 3306个;南方高丛蓝莓与北方高丛蓝莓共有2360个基因家系,其中ungene 4780个;兔眼蓝莓与北方高丛蓝莓共有1585个基因家系,其中ungene 3215个。兔眼蓝莓、南高丛蓝莓和北高丛蓝莓的特异性基因家族分别为9395个、8162个、7144个、7266个。我们还鉴定了所有三种蓝莓共有的12,688个同源单拷贝基因家族和2915个多拷贝基因家族(见表)2无花果1).

表2三种蓝莓中检测到的基因家族摘要
图1
图1

三种蓝莓品种基因家族的维恩分析。T1、T2、T3为兔眼(诉virgatum)、南高丛(诉corymbosum×南方种)和北方高丛蓝莓(诉corymbosum分别)物种。没有括号的数字表示基因家族,括号中的数字表示基因数

蓝莓品种间的遗传关系

在系统发育树中,所有品种聚为两个主要类群,兔眼品种聚为一个主要类群,南高丛和北高丛品种聚为另一个主要类群,然后又分成两个大类群,同一种蓝莓属于同一类群。在由19个品种组成的兔眼组中,样本V.asch01(品种:蓝铃花)和V.asch08(品种:Summit)与其他品种在遗传距离或系统发育关系上均较远,V.asch09(品种:Delite)、V.asch17(品种:Climax)、V.asch19(品种:Bonita)、V.asch13(品种:Bluebelle)、vasch 18(品种:Beckyblue)的亲缘关系较近,其他品种的亲缘关系较近。在13个品种的南方高丛组中,V.cory01(品种:Sharpblue)、V.cory07(品种:O’neal)和V.cory06(品种:Misty)位于系统发育树的底部,亲缘关系较远。在22个品种的北方高丛组中,V.cory30(品种:早熟禾)位于簇底,V.cory15(品种:Sierra), V.cory22(品种:大蓝金),V.cory21(品种:Brigitta), V.cory23(品种:Collins), V.cory18(品种:Bluehaven), V.cory20(品种:Legacy), V.cory24(品种:与V.cory26(品种:泽西)聚在一起形成一个亲缘关系较近的大分支,而其他所有品种聚在一起形成另一个大分支,具有较近的系统发育关系(图2)。2).

图2
figure2

用单拷贝ungenes构建54个蓝莓品种的系统发育树。T1、T2、T3为兔眼(诉virgatum)、南高丛(诉corymbosum×南方种)和北方高丛蓝莓(诉corymbosum)物种,分别

单拷贝同源单基因的选择效应

在3种蓝莓的12,688个单拷贝同源基因中,经Ks > 0.1和适用Ka和Ks过滤后,T1与T2、T1与T3、T2与T3的同源基因分别为2276、2452、1711个。13例、15例和10例直系亲属存在显著的强阳性选择足迹(Ka/Ks > 1);4、6、7直系亲属Ka/Ks值为0.5 < Ka/Ks < 1,显示弱阳性选择足迹;684、721和512个亲缘Ka/Ks显示了纯化选择足迹(Ka/Ks < 0.1);1575、1710和1180三个类群的Ka/Ks在0.1 ~ 0.5之间呈中性进化(见表1)3.无花果3.;表的年代1).共鉴定出32个T1的unigenes, 31个T2的unigenes, 37个T3的unigenes进行了阳性选择(表)4;表的年代2).在这些阳性的选择性单基因中,T1中的9个单基因产生了91个氧化石墨烯项(62个氧化石墨烯项与生物过程有关,18个氧化石墨烯项与细胞成分有关,11个氧化石墨烯项与分子功能有关)。其中4个GO项(GO:0016772、GO:0010506、GO:0031329和GO:0009894)显著富集。T2中10个unigenes共产生185个GO项,其中98个GO项与生物过程有关,39个GO项与细胞成分有关,48个GO项与分子功能有关。其中8个GO项(GO:0010506, GO:0031329, GO:0009894, GO:0010506, GO:0031329, GO:0016485, GO:0051604和GO:0009894)被发现显著富集。T3的14个unigenes产生了234个氧化石墨烯术语(135个氧化石墨烯术语与生物过程相关,38个氧化石墨烯术语与细胞成分相关,61个氧化石墨烯术语与分子功能相关)。其中,6个GO项(GO:0016744、GO:0010506、GO:0031329、GO:0009894、GO:0016485、GO:0051604)显著富集(见表2)4表的年代3.).KEGG数据库注释了8个阳性选择性unigene0035236和T3-Unigene0033665, T2-Unigene0000660和T3-Unigene0000319, T2-Unigene0021375和T3-Unigene0020145, T2-Unigene0023454和T3-Unigene002102为同源对。其中T2-Unigene0023454和T3-Unigene002102是KEGG数据库中推测的编码“Ste24内肽酶”的基因,其ID为3.4.24.84,而“Ste24内肽酶”是KEGG数据库中涉及“萜类骨干生物合成”代谢途径的关键酶,其ID为ko00900。T1-Unigene0035236和T3-Unigene0033665是KEGG数据库中编码“Acetolactate synthase”的基因,其ID为2.1.1.6,Acetolactate synthase是“缬氨酸、亮氨酸和异亮氨酸生物合成(Ko00290)”、“丁酸代谢(Ko00650)”等多途径的关键酶。“c5 -支链二元酸代谢(Ko00660)”“泛酸盐和CoA生物合成(Ko00770)”,这些途径被上述两对同源对攻击,并发现显著富集(Table4;表的年代4).总共有1119、1047和1083年unigenes在T1、T2和T3进行净化选择至少发现了同源的一组(T1和T2, T1和T3和T2和T3),其中,286年,149年和150年unigenes在T1、T2和T3是重叠之间的T1和T2和T1和T3(图。4a)、T1 vs T2、T2 vs T3(图4)。4b) 和T1对T3和T2对T3(图。4分别c)。

表3三种蓝莓品种单拷贝直系数的Ka/Ks检验统计量
图3
图3

三种蓝莓种间单拷贝同源基因Ka/Ks值的分布一个诉virgatumVs诉corymbosumb诉virgatumVS(诉corymbosum×南部物种);c诉virgatumVS(诉corymbosum×南部物种)。x轴为非同义替换率Ka值,y轴为单拷贝同源物的同义替换率Ks值。蓝色图表示Ka/Ks大于1的单拷贝同源性;绿色图表示Ka/Ks介于0.5和1之间的单拷贝同源;红色图表示Ka/Ks在0.1到0.5之间的单拷贝同源性;黑色图表示Ka/Ks小于0.1的单拷贝同源性

表4三个蓝莓品种中发生正选择效应的单基因统计
图4
装具

对三种蓝莓进行纯化选择的ungenes进行了维恩分析。T1、T2、T3为兔眼(诉virgatum)、南高丛(诉corymbosum×南方种)和北方高丛蓝莓(诉corymbosum)物种,分别

三种蓝莓的全基因组复制事件

在T1、T2、T3三个时间点的Ks年龄分布有三个显著的峰,符合正态分布,拟合曲线基本相似。三种蓝莓的第一个峰均以k≈0.11的模式出现,它代表了三种蓝莓在902万年前的进化史上最近一次共同的WGD事件。3种蓝莓在k≈0.53处的第二个峰代表了3种蓝莓在4344万年前的进化史上发生的中共享WGD事件。三种蓝莓在k≈1.42附近的第3个峰表明,在约1.1639亿年前,三种不同蓝莓的进化史上存在一个古老的共同WGD事件。在三个山峰,Ks近期高点的年龄分布为正态分布的最小变化是薄的,而第三个则为正态分布的最大变化最厚,这种趋势是按照随后的二倍化的演化动力学WGD事件(图。5、表5).

图5
figure5

三种蓝莓的钾龄分布。一个诉virgatumb诉corymbosum×南部物种)诉corymbosumc诉corymbosum.x轴表示平行推理的Ks(同义替换率)值,y轴表示特定Ks值范围的平行推理次数

表5中的平均值(μ)和基于Ks的年龄分布拟合曲线的正态分布峰标准偏差(σ)

讨论

蓝莓品种间的遗传关系

阐明生物之间的遗传或系统发育关系对育种项目的亲本选择有很大的帮助[56].近30年来,RAPD、AFLP、SSR、SNP等分子标记在种内和种间个体系统发育关系研究中发挥了重要作用[57,58].在基因组时代,通过使用下一代高通量测序技术以前所未有的速度开发了大规模SNP数据[59,60],这使得SNP标记成为研究生物系统发育关系最常用和最方便的工具[61,62].除上述分子标记外,单拷贝同源基因也被认为是研究种内和种间二倍体或多倍体个体系统发育关系的优良标记[63,64].蓝莓品种来源复杂,系统发育关系的阐明对蓝莓种质资源的鉴定、保护和育种具有重要意义。以往的研究使用不同的分子标记,包括RAPD、SSR和SNP作为工具,构建不同遗传来源的蓝莓种质的系统发育关系[65,66,67,68,69].尽管蓝莓品种或育种材料来源不同,倍性水平不同,但SSR和SNPs标记似乎是区分和分类蓝莓品种的有效工具[65,67,69].本研究利用单拷贝核基因数据重建了三种蓝莓品种的系统发育关系,发现不同来源的蓝莓品种之间存在良好的分化和分组。

T1、T2、T3单拷贝基因的选择效应

全基因组复制事件在开花植物的进化过程中非常普遍[70].然而,一些基因在经历复制事件后会恢复到单拷贝状态,因为在下一次进化过程中,一个拷贝会由于遗传漂变或剂量敏感选择而在基因组中随机丢失[71,72].近年来,单拷贝的基因已经吸引了众多研究人员,因为在遗传学优秀的应用,例如,单拷贝基因是构建物种进化树[一个很好的分子工具73].逻辑上,如果没有重复复制,单拷贝的同源基因就可以视为同源基因,而同源基因不干扰进化分析,这使得单拷贝基因成为生物选择效应和物种形成的分子机制的值得研究的对象[27,34,36,55,64,73,74].在本研究中,我们也仅使用Ka/Ks方法检测单拷贝unigenes来识别选择效应的分子足迹。在进化遗传学中,Ks表示蛋白质编码基因的同义替代率,Ka表示蛋白质编码基因的非同义替代率。一般认为,同义突变不受自然选择的影响,而非同义突变则受自然选择的影响,其原因是编码蛋白中氨基酸组成的变化导致结构和功能的改变[75].嘉/ Ks的指示改变特定蛋白质的结构和不改变特定蛋白质的突变率,和值给出一个清晰的思路去判断整个密切相关,但分歧的物种同源蛋白质编码序列[进化动力学76,77].理论上认为Ka/Ks = 1表示中性进化下的蛋白编码基因,Ka/Ks > 1表示在直系进化中出现的非同义替换较多,说明基因是在正向选择下进化的。Ka/Ks < 1表示通过纯化选择(负选择)消除了有害取代。但在实证研究中,大多数Ka/Ks > 0.5基因结合Tajima’检验和Fu & Li’检验进行了适应性进化,因此Ka/Ks > 0.5的阈值一直被认为是正选择[78,79,80,81].在本研究中,我们按照之前的标准,设置1 > Ka/Ks > 0.5为弱阳性选择,Ka/Ks > 1为强阳性选择。我们还过滤了Ks值为> 0.1的候选直方图,因为它们可能是Zhang等人所描述的拟对数[78和周等人[82].结果表明,大多数单拷贝基因是通过中性模式进化的。部分单拷贝单基因发生了负选择,其数量远多于正选择(表S)2).这一结果说明蓝莓基因组中有害突变的发生频率高于有益突变。在发生正向选择效应的unigene0000660和T3-Unigene0000319同源基因中,我们鉴定了编码“抗病蛋白RPS2”的同源基因(T2-Unigene0000660和T3-Unigene0000319),该同源基因参与“植物-病原体互作(ko04626)”代谢通路(表S4).推测该同源基因为蓝莓品种的选育和改良及其生态适应提供了有益的候选基因。据我们所知,这是关于三个物种的蓝莓基因组或基因选择效应的首次报道。

蓝莓进化史上的全基因组复制

植物基因组学时代的到来揭示了WGD或多倍体在物种进化史上的重要性和普遍性[83],因为利用Ks年龄分布分析、基因组内与基因组间共线区域的检测与比较分析、基于高通量基因组数据构建分子系统发育树等方法,可以方便、准确地重建古WGD事件[84].Ks年龄分布分析具有计算成本相对较低、适用于有限的副组(例如基于EST收集)、不需要副组位置信息等优点,常用于WGD事件的检测[85]因此,在本研究中,我们还使用Ks年龄分布分析来推断T1、T2和T3进化史中的WGD事件。

Ren et al. (2018) [35]利用不同种子植物的105个基因组/转录组数据检测了广泛的WGD事件,包括诉corymbosum,得出WGDs普遍存在于物种丰富的真核生物谱系中。然而,他们没有发现WGD事件诉corymbosum根据转录组数据。诉corymbosum(T2)为多倍体物种,T1和T3为多倍体物种[40],因此应检测T1、T2和T3进化史中最近或新的WGD事件。Colle等人(2019年)[49推断最近的一次多倍体化事件发生在诉corymbosum根据高丛蓝莓同源体之间的Ks差异和4个单倍型之间的配对LTR差异0.18-0.20%,推测在大约69 - 7.7万年前。然而,这种多倍体化现象是否为其他蓝莓物种所共有还不清楚。在本研究中,尽管三种蓝莓不同转录组的Ks年龄分布直方图并不完全一致,但我们在三种蓝莓中检测到三个显著的正态分布峰。根据正态分布曲线拟合,T1、T2、T3第一个峰的中位Ks值和标准差基本相同,第二和第三个峰的趋势相似。因此,根据T1、T2和T3各副对数数据集构建的Ks年龄分布直方图,我们推断蓝莓物种进化史上至少发生了3轮WGD事件。最近WGD事件发生大约904万年前被发现前三个蓝莓物种分化,甚至可能Cyanococcus分化之前的部分,其中包括大约20个物种和它们中的大多数都是多倍体,因为所有三个WGD事件共享的三个物种,而这次WGD事件可能在蓝球藻物种的形成和进化中发挥了重要作用。Vaccinium是物种丰富的属,由约450个物种组成[38].多倍体化事件是植物物种多样化的重要动态[11,86].因此,第二次WGD事件距今约4344万年,可能对属的形成有重要贡献Vaccinium.在本研究中,我们还发现了约1.1639亿年的古WGD事件,这与eudiicots共有的古六倍体化事件(γ)一致[86,87].三种蓝莓种与其他种的中位Ks值的差异可以解释为不同植物谱系间的替代率不同[86,88,89].该结果为蓝莓物种历史上发生的三轮WGD事件提供了清晰的分子足迹,有助于理解蓝莓物种甚至杜鹃花科系复杂进化的分子机制。

结论

单拷贝核基因数据集显示了不同来源蓝莓品种的良好分化和分组。蓝莓中一些重要的功能基因发生了正向选择,并表现出适应性进化模式。在蓝莓物种的进化史上,至少检测到3轮WGD事件。我们的工作为蓝莓的适应进化和物种辐射的遗传机制提供了深刻的见解Vaccinium在短的地质尺度时间内。

方法

蓝莓转录组蛋白质编码序列的鉴定

以19个兔眼蓝莓品种、13个南方高丛蓝莓品种和22个北方高丛蓝莓品种(Genbank Accession ID: PRJNA511922)的叶片转录组为基础,分别分析了45,535、42,914和43,630条ungenes。样本信息、库的构建、unigenes的测序和装配等已经发表并描述过[55].简而言之,54个蓝莓品种(信息列于图。2)采集自贵州省麻江县玄威镇五羊马村蓝莓产业工程技术中心蓝莓种质圃,采用总RNA试剂盒(STRN50-1KT|Sigma)从幼叶中提取总RNA,严格按照公司提供的指导原则提取。RNA测序文库的制备方法如下:首先用DNAse处理总RNA,然后用poly-T-oligo-attached magnetic beads过滤总RNA中含有poly- a的mRNA。其次,从纯化的mRNA序列中获得约300 ~ 500个碱基长度片段,以这些片段为模板生成cDNA的第一单链,然后从cDNA的第一链生成cDNA的第二链。然后,通过15周期pcr反应,最终确定定量纯化的双链测序文库。最后使用Illumina HighSeq 4000平台进行配对端测序。然后使用Trinity将高质量的clean reads(≥Q20)组装成具有默认参数的unigenes [90].

在本研究中,我们从上述ungenes中鉴定了所有可能的蛋白编码序列,以供进一步分析。首先,我们blastx (ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/),将unigenes序列按Nr (http://www.ncbi.nlm.nih.gov),瑞士门卫(http://www.expasy.ch/sprot), KEGG [18]及COG/KOG [91] (e值截止水平<1E-5)。Unigene序列按照上述顺序与数据库中的蛋白序列逐步比对。除非在当前数据库中找到重要的匹配,否则迭代过程将继续进行。然后,我们从blast比对结果中选择rank最高的蛋白,确定ungenes的编码区序列,然后根据标准密码子表将编码序列翻译成氨基酸序列,从而获得该基因的核酸序列(序列方向5 ' - > 3 ')和编码区域的氨基酸序列。最后,我们利用ESTScan程序预测了与上述4个数据库进行比对的unigenes的编码区(5 ' - > 3 '方向的核酸序列)及相应的蛋白序列[92].仅使用Nr、Swiss-Prot、KEGG和COG/KOG数据库注释的unigenes或ESTScan程序预测的编码区进行进一步分析。

编码序列和基因家族的预测

ESTScan程序注释或预测的单基因编码区与Blastp软件成对对齐[93].比对后,e值低于1E-7的成对单基因视为种内或种间同源单基因。然后使用OrthoMCL软件v2.0.9,采用默认参数(identity, coverage)将unigenes、homologs(即orthologs和parogs)相互划分为同一基因家族[94].有三种蓝莓物种的转录不止一个单一基因的基因家族被认为是多拷贝基因家族,否则视为单拷贝基因家族。只有从一个蓝莓品种的个Unigenes基因家族被定义为物种特异性的基因家族。同时,还获得了同源的或独特的基因或基因家族,然后基因家族的数量和三个蓝莓种类对应个Unigenes数由Venny工具计数并进行分析(https://bioinfogp.cnb.csic.es/tools/venny/).

用单拷贝ungenes构建系统发育树

通过构建基于同源基因单拷贝的分子进化树,阐明了蓝莓品种间的遗传关系。首先,我们利用ClustalW (https://www.genome.jp/tools-bin/clustalw).其次,将所有单拷贝基因家族的多序列比对连接在一起,得到总单拷贝基因序列文件,用于构建进化树。最后,利用MEGA软件(https://www.megasoftware.net/),在系统发生树中以核苷酸替代率作为分支长度的进化单位。

单拷贝ungenes的Ka/Ks检验

我们利用软件肌肉(http://www.drive5.com/muscle)在MEGA10.1软件中实现(https://www.megasoftware.net/).比对序列使用RevTrans 1.4转化为相应的核苷酸序列[95].利用KaKs_Calculator Toolbox利用标准遗传代码表(version 2.0)估算T1、T2、T3的非同义替换率(Ka)、同义替换率(Ks)以及T1与T2、T1与T3、T2与T3的所有同源基因对(orthologo)的Ka/Ks [7].我们过滤了没有适用的Ka或Ks值或Ks值> 0.1(潜在平行对数的基准)的单拷贝正交[74,78,96].Ka和Ks值的有效性由Zhou et al.(2016)所描述的Fisher精确检验来证明[82],根据Yang & Bielawski(2000)的卡方检验结果,当P < 0.05,后验概率为> 0.95时,允许阳性或阴性选择位点[97和Hu等人(2018)[79].大多数非同义突变的Ka/Ks值较低是有害的,同源基因的单拷贝没有拷贝,使生物体对有害突变的耐受性降低。因此,为了找出发生正选择但可能被大量有害突变位点中和(或覆盖)的ungenes,我们将Ka/Ks > 1的单拷贝同源基因定义为强正选择,Ka/Ks值在0.5 ~ 1之间为弱正选择。根据以前的报告,Ka/Ks < 0.1为负选择(净化选择)[74,79,80,81].GO和KEGG富集分析采用GOseq [98]及KOBAS [99]的强阳性、弱阳性和负阳性选择的直系亲属集合。的p对于显著富集的假设检验的 - 值公式为如下:

$ $ P = 1 - \ \ limits_总和我= {0}^ {M - 1} \压裂{\离开(\{数组}{c}开始M \ \{}我\{数组}\)\离开(\开始{数组}}{c N - M \ \{}{数组}\ N \端)}{\离开(\{数组}{c}开始N \ \{} \结束数组{}\右)}$ $

其中,N为所有unigenes中具有pathway(或GO)注释的基因数量;n为n中种特异基因的数量;M为所有unigenes中具有特定通路(或GO)注释的基因数量;m为具有特定通路(或GO)注释的基因数量。计算P-值通过Bonferroni检验进一步校正,KEGG通路(或GO term)与p-value < 0.05定义为物种特异性基因显著富集的GO项(或GO项)。

重复单基因对的Ks年龄分布

我们从编码序列(cds)中鉴定了每个蓝莓作物的重复unigenes对(parogs),通过不连续all-against-all MegaBLAST测量,序列相似性至少为300 bp,为40% [One hundred.,101].我们所使用的软件的肌肉(http://www.drive5.com/muscle)比对同源蛋白的蛋白质序列,比对后利用RevTrans 1.4将序列转化为相应的核苷酸序列[61].我们使用带有标准遗传代码表(2.0版)的KaKs_Calculator Toolbox计算每个蓝莓作物所有拟对数的k [95].为了避免产生多拷贝基因家族的增殖效应的Ks饱和效应,我们像Shi等人所做的那样,用Ks > 2过滤了parogs [32].我们构建了Ks密度(年龄)与用于每个情节0.03带宽分布的直方图,并装有由mixtools程序高斯混合模型的正态分布曲线,其构建中的R软件[102].我们使用公式T来推断重复事件的年龄多样性=Ks/2r as Zhang et al. (2019b) [103].我们设定了工厂的平均值Ks/year rate = 6.1 × 10−9根据Lynch&Conery(2000年)的说法,为了估计蓝莓物种中WGDs的年龄,每个峰值的中值Ks值被用来确定WGDs的年龄[104].

数据和材料的可用性

当前研究期间生成和/或分析的数据集可在Genbank(可访问ID:PRJNA51922)[NCBI]存储库中获得,

链接:https://www.ncbi.nlm.nih.gov/search/all/?term=PRJNA511922,以及在本研究中使用和/或分析的数据集,可由通讯作者根据合理要求提供。

缩写

WGD:

全基因组复制

T1:

兔眼蓝莓

T2:

南方高丛蓝莓

T3:

北高丛蓝莓

米娅:

万年前

参考文献

  1. 1.

    Basener WF, Sanford JC。关于突变的自然选择基本定理。J Math Biol. 2018; 76:1589-622。

    PubMed文章谷歌学者

  2. 2.

    遗传与选择的理解。Nat Rev Genet, 2009; 10:83-93。

    CASPubMed文章谷歌学者

  3. 3.

    Feder AF, Kryazhimskiy S, Plotkin JB。识别遗传时间序列中的选择特征。遗传学。2014;196(2):509 - 22所示。

    PubMed文章谷歌学者

  4. 4.

    翟卫东,王志强,王志强,等。基于比较和群体遗传数据的中性检验的统计效能研究。中国生物医学工程学报。2009;26(2):273-83。

    CASPubMed文章谷歌学者

  5. 5.

    Vitti JJ, Grossman SR, Sabeti PC。在基因组数据中检测自然选择。Annu Rev Genet. 2013; 47:97-120。

    CASPubMed文章谷歌学者

  6. 6.

    赫斯特LD。嘉/ Ks率:诊断序列进化的形式。遗传学趋势。2002; 18:486。

    PubMed文章谷歌学者

  7. 7.

    KaKs_calculator:通过模型选择和模型平均计算Ka和Ks。基因组学、蛋白质组学、生物信息学。2006;4(4):259-63。

    CASPubMed文章谷歌学者

  8. 8.

    杜明志,刘胜,曾智,阿勒马耶胡,罗卫伟,郭FB。氨基酸组成在丰度和基因组GC含量的影响下促进了蛋白质的进化。Sci众议员8:73 2018;82年。

    文章CAS谷歌学者

  9. 9

    Kellis M, Birren BW, Lander ES。酵母中古老基因组复制的证明和进化分析酿酒cereviseae.大自然。2004;428:617-24。

    CASPubMed文章谷歌学者

  10. 10.

    Doyle JJ, Flagel LE, Paterson AH, Rapp RA, Soltis DE, Soltis PS, Wendel JF。植物基因组合并和加倍的进化遗传学。Annu Rev Genet, 2008; 42:443-61。

    CASPubMed文章谷歌学者

  11. 11.

    acta botanica yunnanica(云南植物研究中心);acta botanica yunnanica yunnanica(云南植物研究中心);Am J Bot. 2009; 96:336-48。

    文章PubMed谷歌学者

  12. 12.

    Vanneste K, Maere S, Peer YV。纠缠在一起的有两件事:白垩纪末期基因组复制的爆发和对植物进化的影响。Phil Trans R Soc B. 2014a;369:20130353。

    PubMed文章谷歌学者

  13. 13.

    Edger PP, Heidel-Fischer HM, Bekaert M, Rota J, Glöckner G, Platts AE, Heckel DG, Der JP, Wafula EK, Tang M, et al.;蝴蝶植物的军备竞赛因基因和基因组复制而升级。中国科学院院刊2015;112:8362-6。

    CASPubMed公共医学中心文章谷歌学者

  14. 14.

    Tank DC, Eastman JM, Pennell MW, Soltis PS, Soltis DE, Hinchliff CE, Brown JW, Sessa EB, Harmon LJ。巢状辐射和被子植物多样化的脉冲:多样化率的增加通常伴随着整个基因组的重复。新植醇。2015;207:454 - 67。

    PubMed文章谷歌学者

  15. 15.

    古代WGD事件作为被子植物关键创新的驱动因素。植物生物学杂志。2016;30:159-65。

    谷歌学者

  16. 16.

    acta botanica yunnanica(云南植物研究中心),2009,29(4):429 - 434。Am J Bot. 2018; 105:433-44。

    文章谷歌学者

  17. 17.

    《达尔文评论:被子植物系统发育和进化辐射》。Proc R Soc B. 2019;286:20190099。

    文章谷歌学者

  18. 18.

    Kihara H,Ono T.染色体和系统研究鲁梅克斯·阿尔滕的Gruppierung.Z Zellforsch Mikr Anat.1926;4:475-81。

    文章谷歌学者

  19. 19

    拉姆齐Ĵ,Schemske DW。途径,机制和开花植物多倍体形成的速率。Annu启ECOL SYST。1998; 29:467-501。

    文章谷歌学者

  20. 20.

    Barker MS, Arrigo N, Baniaga AE, Li Z, Levin DA。自多倍体和异源多倍体的相对丰度。新植醇。2016;210:391-8。

    PubMed文章谷歌学者

  21. 21.

    张丽,shvute FN, Shahid MQ, Kamara N, Wu J, Liu X. non - autoallo四倍体的体外诱导选用阿尔塔沃伦。植物细胞组织器官培养。2019a: 139:577-87。

  22. 22.

    Vanneste K, Baele G, Maere S, Van de Peer Y.对41个植物基因组的分析支持了白垩纪-古近纪边界基因组复制的成功浪潮。基因组研究》2014 b; 24:1334-47。

    CASPubMed公共医学中心文章谷歌学者

  23. 23.

    Jiao Y, Wickett NJ, Ayyampalayam S, Chanderbali AS, Landherr L, Ralph PE, Tomsho LP, Hu Y, Liang H, Soltis PS, et al.;种子植物和被子植物的祖先多倍体。大自然。2011;473:97 - 100。

    CASPubMed文章谷歌学者

  24. 24.

    沃尔夫KH。昨天的多倍体和二倍体的奥秘。Nat Rev Genet, 2001;2:33 - 41。

    CASPubMed文章谷歌学者

  25. 25.

    多倍体和基因组重组:各种结果。Curr Opin Genet Dev. 2009; 19:600-6。

    CASPubMed文章谷歌学者

  26. 26.

    Zakas C、Schult N、McHugh D、Jones KL、Wares JP。转录组分析和单核苷酸多态性开发可以解决发展中的二型海洋环节动物streblospio benedicti的种群分化问题。公共科学图书馆一号。2012;7(2):e31613。

    CASPubMed公共医学中心文章谷歌学者

  27. 27.

    杨勇,李X,香港X,马L,胡X,杨Y.转录组分析揭示沿西藏高原干旱梯度紫花针茅的多样化适应。本功能基因组学INTEGR。2015A; 15(3):295-307。

    CASPubMed文章谷歌学者

  28. 28.

    引用本文:王志强,王志强,王志强,等。被囊动物比较研究的系统基因组框架和时间尺度。BMC医学杂志。2018;16:39。

    PubMed公共医学中心文章CAS谷歌学者

  29. 29.

    小麦连续波。通过454转录组测序在生态模型系统中快速发展功能基因组学。遗传。2010;138:433-51。

    CASPubMed文章谷歌学者

  30. 30.

    达菲K.甲蓝莓富集的饮食提供抗氧化应激的细胞保护和降低大鼠中红藻氨酸盐诱发的学习障碍。神经生物学老化。2008; 29(11):1680-9。

    CASPubMed文章谷歌学者

  31. 31.

    德威特P,Pespeni MH,Palumbi SR。SNP基因分型和基因组学的人口从表达序列 - 当前进展和未来的可能性。摩尔ECOL。2015; 24:2310-23。

    文章谷歌学者

  32. 32.

    史涛,黄海涛,黄海涛,等。猕猴桃及其亲缘植物进化过程中基因组的古老复制。安机器人。2010;106:497 - 504。

    PubMed公共医学中心文章谷歌学者

  33. 33.

    张丽,严海峰,吴伟,于辉,葛晓军。两种近缘报春花的转录组比较分析和标记发展(报春花poissonii樱草属植物wilsonii)《BMC基因组学》,2013a;14(1):329。

    CASPubMed公共医学中心文章谷歌学者

  34. 34.

    乔强,王强,韩旭,关勇,孙辉,钟勇,黄娟,张涛Crucihimalaya himalaica(十字花科)揭示拟南芥近缘植物如何适应青藏高原。Sci众议员2016;6:21729。

    CASPubMed公共医学中心文章谷歌学者

  35. 35.

    任瑞,王华,郭超,张宁,曾玲,陈勇,马辉,齐建军。被子植物全基因组广泛复制对基因组复杂性和物种多样性的影响。摩尔。2018;11(3):414 - 28。

    CASPubMed文章谷歌学者

  36. 36.

    任艳,朱艳,王强,向辉,王斌翅kingtungense揭示了其快速营养生长和石灰岩适应的机制。Sci众议员2017;7:3198。

    PubMed公共医学中心文章CAS谷歌学者

  37. 37.

    Kron KA, Judd WS, Stevens PF, Crayn DM. Anderberg AA,5 Gadek PA, Quinn CJ, Luteynj L.系统发育分类:分子和形态学证据。机器人启2002;68(3):335 - 423。

    文章谷歌学者

  38. 38.

    Mabberley DJ。《植物之书:维管植物便携式词典》(第二版),剑桥:剑桥大学出版社;1997.p。740。

    谷歌学者

  39. 39.

    宋QS,汉考克JF。蓝莓转化研究进展。诠释J水果科学。2012; 12:316-32。

    文章谷歌学者

  40. 40.

    Lyrene PM,Vorsa N,Ballington J.多倍体和属中的有性多倍化Vaccinium.Euphytica。2003;133(1):27-36。

    文章谷歌学者

  41. 41.

    汉考克JF, Lyrene P, Finn CE, Vorsa N, Lobos GA。蓝莓andcranberries。出自:Hancock JF,编辑。温带水果作物育种。纽约:施普林格;2008.115 - 49页。

    章节谷歌学者

  42. 42.

    美国农业部国家农业统计局(2017)2016年非柑橘类水果和坚果概述。http://usda.mannlib.cornell.edu/usda/current/noncfruinu/noncfruinu - 06 - 27 - 2017. - pdf。2017年10月3日

    谷歌学者

  43. 43.

    Cho E, Seddon JM, Rosner B, Willett WC, Hankinson SE。水果、蔬菜、维生素和类胡萝卜素摄入量与年龄相关性黄斑病风险的前瞻性研究角膜切削。2004;122:883 - 92。

    PubMed文章谷歌学者

  44. 44.

    蓝莓与人类健康:当前研究综述。J Am Pomol Soc. 2007; 61:151-60。

    谷歌学者

  45. 45.

    白藜芦醇,紫檀烯和白藜芦醇Vaccinium《农业食品化学杂志》,2004;52:4713-9。

    CASPubMed文章谷歌学者

  46. 46.

    蓝莓、蔓越莓和越橘。在:Janick J, Moore JN,编辑。水果育种,第二卷。纽约:威利;1996.1 - 107页。

    谷歌学者

  47. 47.

    从冷驯化到脱驯化,蓝莓叶片、果实和花转录组序列的生成和分析。BMC Plant Biol. 2012;12:46。

    CASPubMed公共医学中心文章谷歌学者

  48. 48.

    Gupta V, Estrada AD, Blakley IC, Reid R, Patel K, Meyer MD, Andersen SU, Brown AF, Lila MA, Loraine AE。通过RNA-Seq分析和注释一个拟蓝莓基因组组装,识别了参与果实成熟、生物活性化合物生物合成和阶段特异性选择性剪接的候选基因。GigaScience。2015; 4:5。

    PubMed公共医学中心文章谷歌学者

  49. 49.

    王俊杰,王俊杰,王俊杰,唐华,等。四倍体蓝莓的单倍型阶段基因组和植物营养途径的进化。GigaScience。2019; 8(3)。https://doi.org/10.1093/gigascience/giz012

  50. 50.

    陈志强,陈志强,陈志强,等。蓝莓低温响应性脱氢酶的分子遗传和生理分析。J Crop improvv . 2004; 10:53-76。

    CAS文章谷歌学者

  51. 51.

    Dhanaraj AL, Alkharouf NW, Beard HS, Chouikha IB, Matthews BF, Wei H, Arora R, Rowland LJ。田间和室内冷驯化条件下蓝莓转录谱的主要差异。足底。2007;225:735-51。

    CASPubMed文章谷歌学者

  52. 52.

    Rowland LJ,Dhanaraj AL,Naik D,Alkharouf N,Matthews B,Arora R.利用EST文库cDNA微阵列和差减杂交研究蓝莓的耐寒性。HortScience.2008;43:1975-81。

    文章谷歌学者

  53. 53.

    李晓霞,孙辉,裴健,董勇,王飞,陈辉,孙颖,王宁,李华,李勇。蓝莓转录组的De novo测序及抗氧化基因的比较分析。基因。2012;511(1):54 - 61。

    CASPubMed文章谷歌学者

  54. 54.

    蓝莓抗性与易感品种的差异表达基因的鉴定炭疽菌acutatum.植物病理学杂志。2011;12(5):463-7。

    CASPubMed公共医学中心文章谷歌学者

  55. 55.

    转录组分析与注释:三种多倍体蓝莓作物单拷贝注释单基因的SNPs鉴定。《公共科学图书馆•综合》。2019;14 (4):e0216299。

    CASPubMed公共医学中心文章谷歌学者

  56. 56.

    sengon的遗传多样性(Falcataria moluccana(筛选)。Barneby & J.W. Grimes)利用单核苷酸多态性标记揭示。中国林业科学(英文版);2017;4(2):85-94

    文章谷歌学者

  57. 57.

    单核苷酸多态性在蓖麻遗传多样性评估中的应用(萝藦).BMC Plant Biol. 2010;10:13。

    PubMed公共医学中心文章CAS谷歌学者

  58. 58.

    Nadeem MA, Nawaz MA, Shahid MQ, Doğan Y, Comertpay G, Yıldız M, Hatipoğlu R, Ahmad F, Alsaleh A, Labhane N,等。植物育种中的DNA分子标记:基因组选择和基因组编辑的现状和进展。生物技术装备。2018;32:261-85。

    CAS文章谷歌学者

  59. 59.

    汤姆森乔丹。高通量SNP基因分型加速作物改良。植物育种技术。2014;2(3):195-212。

    文章谷歌学者

  60. 60.

    Zhao Y Y, Wang K, Wang W, Yin T, Dong W, Xu C. A high throughput SNP discovery strategy for RNA-seq data。BMC基因组学。2019;20:160。

    PubMed公共医学中心文章谷歌学者

  61. 61.

    李涛,郭洪,王旭,金灿,王志强。SNPhylo:从大量SNP数据构建系统发育树的管道。BMC基因组学。2014;15:162。

    PubMed公共医学中心文章谷歌学者

  62. 62.

    Ahmed SA, Lo CC, Li PE, Davenport KW, Chain PSG。从原始读取到树:跨越生命树的全基因组SNP系统发育。BioRxiv。2015.https://doi.org/10.1101/032250

  63. 63.

    关键词:转录组,转录组,分类,基因工程abstractCroomia百合科CYC/TB1基因的种类及分子进化。植物多样性。2018;40(6):253 - 64。

    PubMed公共医学中心文章谷歌学者

  64. 64.

    易胜,周旭,李军,张敏,罗珊珊Misgurnus anguillicaudatus提供对属进化的见解Misgurnus、 Sci Rep.2018;8:11699。

    PubMed公共医学中心文章CAS谷歌学者

  65. 65.

    利用随机扩增多态性DNA分析方法确定低丛蓝莓基因型的遗传关系。中华医学杂志。2002;127(1):98-103

    CAS文章谷歌学者

  66. 66.

    崔娟,刘华,邹锐,梁艳,李艳,文杰。云南松花江种质资源遗传多样性及系统发育关系研究越桔属.果树科学;2010;27(3):373-8。

    CAS谷歌学者

  67. 67.

    高丛蓝莓EST-PCR标记也可用于兔眼蓝莓的遗传指纹分析和亲缘关系研究。Sci Hortic。2010;125:779 - 84。

    CAS文章谷歌学者

  68. 68.

    Bian Y, Ballington J, Raja A, Brouwer C, Reid R, Burke M, Wang X, Rowland LJ, Bassil N, Brown A.栽培蓝莓的简单序列重复模式Vaccinium部分Cyanococcus属)及其在揭示遗传多样性和种群结构的使用。分子育种。2014; 34:675-89。

    CAS文章谷歌学者

  69. 69.

    坎帕A,费雷拉JJ。通过基因分型测序(GBS)评估蓝莓品种的遗传多样性和物候特征。《公共科学图书馆•综合》。2018;13 (10):e0206361。

    PubMed公共医学中心文章CAS谷歌学者

  70. 70.

    张杰。基因复制进化:最新进展。趋势生态进化。2003;18(6):292-8。

    文章谷歌学者

  71. 71.

    Birchler JA, Riddle NC, Auger DL, Veitia RA。基因调控中的剂量平衡:生物学意义。趋势麝猫。2005;21(4):219 - 26所示。

    CASPubMed文章谷歌学者

  72. 72.

    Edger PP, Pires JC。基因和基因组复制:剂量敏感性对核基因命运的影响。Chromosom杂志2009;17(5):699 - 717。

    CAS文章谷歌学者

  73. 73.

    韩震,马旭,魏明,赵涛,詹荣,陈伟。SSR标记的开发及种内遗传分化研究野菊花基于转录组分析。BMC基因组学。2018;19:29。

    文章CAS谷歌学者

  74. 74.

    卢如蓉,徐文奇,卢庆新,等。两种克罗米属植物转录组的生成与分类及茎科CYC/TB1基因的分子进化植物多样性。2018;40(6):253 - 64。

    PubMed公共医学中心文章谷歌学者

  75. 75.

    王志强,王志强,王志强,等。蛋白质结构域和家族的基因特性及其位点到位点同义率的变化。《公共科学图书馆•综合》。2014;9 (6):e95034。

    PubMed公共医学中心文章谷歌学者

  76. 76.

    Hughes AL,Nei M.《主要组织相容性复合体I类基因座的核苷酸替换模式显示超显性选择》,《自然》1988;335(6186):167-70。

    CASPubMed文章谷歌学者

  77. 77.

    费京成,吴慈。蛋白质进化中的序列差异、功能约束和选择。基因组学学报2003;4:213-35。

    CASPubMed文章谷歌学者

  78. 78.

    张杰,谢平,拉斯科M,米格尔TR,刘杰。两种荒漠杨树的快速进化基因与胁迫适应。PLoS ONE。2013b;8:e66370。

    CASPubMed公共医学中心文章谷歌学者

  79. 79.

    胡强,王强,田华,肖辉。比较转录组揭示大鲵潜在的适应进化基因。Hereditas。2018;155:18。

    PubMed公共医学中心文章谷歌学者

  80. 80.

    Swanson WJ,Wong A,Wolfner MF,Aquadro CF.《果蝇雌性生殖道的进化表达序列标签分析识别正选择基因》。遗传学。2004;168(3):1457-65。

    CASPubMed公共医学中心文章谷歌学者

  81. 81.

    任磊,谭晓军,熊云飞,徐坤,周勇,周辉,刘勇,洪勇,刘胜。转录组分析显示上颌培养鱼与斑马鱼差异的正向选择。基因。2014;552(2):265 - 71。

    CASPubMed文章谷歌学者

  82. 82.

    周涛,陈超,魏勇,常勇,常勇,白刚,李志,Kanwal N,赵国刚。两种近缘双翅目植物转录组和叶绿体基因组的比较分析。植物学报2016;7:1512。

    PubMed公共医学中心谷歌学者

  83. 83.

    霍利斯特JD。多倍性:对基因组环境的适应。新植醇。2015;205:1034-9。

    PubMed文章谷歌学者

  84. 84.

    范德皮尔Y,福西特JA,普罗斯特S,斯特克L,范德波尔K.开花的世界:复制的故事。植物科学进展。2009;14:680-8。

    PubMed文章CAS谷歌学者

  85. 85.

    Cui L, Wall PK, Leebens-Mack JH, Lindsay BG, Soltis DE, Doyle JJ, Soltis PS, Carlson JE, Arumuganathan K, Barakat A, ViA A, Ma H, DE Pamphilis CW。在开花植物的历史中广泛存在的基因组复制。基因组研究》2006;16:738-49。

    CASPubMed公共医学中心文章谷歌学者

  86. 86.

    (1)被子植物的起源和早期进化。北京大学学报(自然科学版)2008;1133 - 25。

    CASPubMed文章谷歌学者

  87. 87.

    古六倍体(Gamma hexaploidy)与核心双二体茎系的关系:MADS-box基因与物种多样性的关系。中国生物化学学报。2012;29:3793-806。

    CASPubMed文章谷歌学者

  88. 88.

    王凯,王铮,李飞,叶伟,叶伟,王建,宋刚,岳智,丛林,尚辉,朱绍生,等。二倍体棉花的基因组草图Gossypium raimondii就.Nat麝猫。2012;44:1098 - 103。

    CASPubMed文章谷歌学者

  89. 89.

    Smith博士,Arrigo KR, Alderkamp AC, Allen AE。线粒体、质体和核基因的同义替换率存在巨大差异棕囊藻属海藻但是此属.分子系统学进展。2014;71:36-40。

    CASPubMed文章谷歌学者

  90. 90.

    Grabherr MG, Haas BJ, Yassour M, Levin JZ, Thompson DA, Amit I,等。没有参考基因组的RNA-Seq数据的全长度转录组组装。自然生物技术。2011; 29(7): 644 - 52。

    CAS文章谷歌学者

  91. 91.

    Tatusov RL,Galperin MY,Natale DA,Koonin EV.COG数据库:蛋白质功能和进化的基因组规模分析工具.核酸研究,2000;28:33-6。

    CASPubMed公共医学中心文章谷歌学者

  92. 92.

    ESTScan:一种检测、评估和重建EST序列中潜在编码区域的程序。Proc Int Conf Intell Sys Mol Biol. 1999; 99:138-48。

  93. 93.

    Stephen A, Gi W, Mi W, Eugene M, David L.基本局部对齐搜索工具。中华医学会昆虫学分会。

    文章谷歌学者

  94. 94.

    李丽丽,李志强,李志强,等。真核生物基因组同源群的鉴定。基因组研究》2003;13:2178 - 89。

    CASPubMed公共医学中心文章谷歌学者

  95. 95.

    Wernersson R,Pedersen AG.RevTrans:从对齐的氨基酸序列编码DNA的多重对齐。核酸研究。2003;31:3537–9。

    CASPubMed公共医学中心文章谷歌学者

  96. 96.

    Bustamante CD、Fledel-Alon A、Williamson S、Nielsen R、Hubisz MT、Glanowski S、Tanenbaum DM、White TJ、Sninsky JJ、Hernandez RD等。人类基因组蛋白质编码基因的自然选择。大自然。2005;437:1153-7。

    CASPubMed文章谷歌学者

  97. 97.

    杨泽,Bielawski JP。检测分子适应性的统计方法。生态学报。2000;15(12):496。

    CASPubMed公共医学中心文章谷歌学者

  98. 98.

    年轻的医学博士,韦克菲尔德MJ,史密斯GK,奥什莱克AJGB。RNA-seq的基因本体论分析:考虑选择偏差。基因组医学杂志。2010;11 (2):R14。

    PubMed公共医学中心文章CAS谷歌学者

  99. 99.

    Mao X, Cai T, Olyarchuk JG, Wei LJB。使用KEGG Orthology (KO)作为控制词汇的自动化基因组注释和路径识别。生物信息学。2005;21(19):3787 - 93。

    CASPubMed文章谷歌学者

  100. One hundred.

    张梓,施瓦茨S,瓦格纳L,米勒W.一种DNA序列比对的贪婪算法.计算机生物学学报.2000;7:203-14。

    CAS文章PubMed谷歌学者

  101. 101.

    马斌,李敏。模式搜索:更快速、更灵敏的同源搜索。生物信息学。2002;18:440-5。

    CASPubMed文章谷歌学者

  102. 102.

    Mixtools:一个用于分析有限混合模型的R包。统计软件。2009;32(6):1-29。

    文章谷歌学者

  103. 103.

    张锐,王发方,张健,尚辉,刘丽,王辉,赵光华,沈辉,严永华。测定全基因组复制的年代Ceratopteris thalictroides保留基因重复的潜在适应值。国际分子科学杂志,2019b;20:1926。

    CAS公共医学中心文章谷歌学者

  104. 104.

    Lynch M, Conery JS。重复基因的进化人口学。结构与功能。2000;3:35-44。

    文章谷歌学者

下载参考

确认

作者感谢实验室成员在这项研究中给予的帮助。

资金

贵州省教育厅重点项目[KY(2013)186];贵州省科技厅项目[(2015)6013]和[(2016)5202];国家自然科学基金项目[31560091]。

作者信息

从属关系

作者

贡献

WYS构思并设计了实验。WYS, MQS, FSB和NF撰写了这篇论文。WYS和NF进行了实验。WYS和MQS分析了数据。所有作者阅读并批准了手稿的最终版本。

相应的作者

对应于(王

道德声明

伦理批准和同意参与

本研究中使用的植物样本不是从国家公园或自然保护区采集的。根据国家和地方立法,采集这些植物不需要特别许可。我们确认,这符合国家指南,在这种特殊情况下,不需要正式的道德审批。

同意出版

不适用。

相互竞争的利益

两位作者宣称他们没有相互竞争的利益。

额外的信息

出版商的注意

施普林格《自然》杂志对已出版的地图和机构附属机构的管辖权要求保持中立。

补充信息

附加文件1:表S1。

统计三种蓝莓中发生选择效应的基因。

附加文件2:表S2。

阳性选择的unigenes注释摘要。

附加文件3:表S3。

氧化石墨烯富集总结了三种蓝莓中发生阳性选择的ungene。

附加文件4:表S4。

对三种蓝莓中发生阳性选择的ungene进行KEGG富集总结。

权利和权限

开放获取本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。本文中的图像或其他第三方材料都包含在本文的知识共享许可中,除非在该材料的信用额度中另有说明。如果资料不包括在文章的知识共享许可协议中,并且你的预期用途没有被法律规定允许或超过允许用途,你将需要直接从版权所有者获得许可。如欲查阅本许可证副本,请浏览http://creativecommons.org/licenses/by/4.0/.创作共用及公共领域专用豁免书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信贷额度中另有说明。

重印和许可

关于这篇文章

通过交叉标记验证货币和真实性

引用这篇文章

王,Y.,聂,F.,沙希德,M.Q.et al。三种蓝莓的选择效应和全基因组复制(WGD)事件的分子足迹:通过转录组数据集检测。BMC植物杂志20.250(2020)。https://doi.org/10.1186/s12870-020-02461-w

下载引用

关键字

  • 自适应进化
  • 系统发育分析
  • 多倍体
  • Unigene
  • Vaccinium