跳转到主要内容

人口遗传结构和基因流动的罕见和濒危Tetraena樟子松的的格言。通过减少表达序列揭示

摘要

背景

研究植物种群的遗传结构和基因流动及其影响因素在保护生物学领域具有特殊的意义,特别是对珍稀濒危植物等物种具有重要意义。Tetraena樟子松的的格言。(TM)是一种分布狭窄的珍稀濒危植物。然而,近十年来,由于过度砍伐、城市扩张、工业和旅游业的发展,栖息地的破碎化和自然栖息地的丧失已成为濒危植物种群的主要威胁。

结果

本研究采用简化表示测序技术对TM群体的遗传多样性、群体遗传结构和基因流进行评估,共获得133.45 GB以上的高质量clean reads和38,097个高质量SNPs。基于多种方法的分析结果表明,现有TM居群具有中等水平的遗传多样性,但居群间的遗传分化水平很低,居群间的基因流动水平较高。种群结构和主坐标分析表明,8个TM种群可分为2类。Mantel检验结果表明,整个抽样的地理距离与遗传距离之间无显著相关关系。此外,迁移模型表明,历史上基因流动更多的是一种由北向南的迁移模式。

结论

本研究表明,目前的遗传结构主要是由于城市蔓延,工业发展和煤炭开采引起的栖息地碎片。我们关于保护管理的建议是,所有8个人口都应保存为整个人口,而不仅仅是TM自然保护区核心领域的人口。特别是,在城市和工业区的TM分布边缘附近的人口值得我们的特殊保护。

背景

人口遗传结构是生态和遗传过程之间相互作用的结果。遗传结构和基因流动的研究在理解遗传特征和人群动力学方面发挥着重要组成部分,特别是那些具有有限的地理范围的稀有和濒危物种。这主要是因为他们的群体更容易受损,基因流被认为是植物种群遗传结构最重要的决定因素之一[1].除了植物特征的影响外,人口的历史事件,生态因素,自然选择因素,人类活动干扰,历史事件和其他因素也将导致人口中遗传结构的形成。人类活动的栖息地分散如此严重威胁到可能导致人口萎缩甚至灭绝的植物种群的可行性[2].导致种群数量下降的主要原因是,大型和连续的栖息地被划分为孤立的和较小的斑块。一些研究表明,即使是在主要由自然栖息地组成的地区,种群或个体之间的基因流动也会受到城市发展的限制[3.],导致栖息地降解和碎片[4.].

与遗传多样性,人口遗传结构和基因流动研究有关的早期研究在很大程度上依赖于传统分子标记(随机扩增的多态性DNA,简单序列重复,扩增的片段长度多态性,限制性片段长度多态性等)。然而,这些标志物在解决人群地理分化时具有自己的局限性,特别是在使用少数遗传标记时。此外,开发传统的分子标记不仅需要时间和努力,而且还涉及复杂的步骤,最重要的是它们昂贵。目前,整个基因组测序仍然非常昂贵,特别是数百个样品的测序。随着高通量排序技术的快速发展,到目前为止,科学家们通过基因组DNA的限制酶消化制定了各种降低的表示基因组测序[5.6.7.],而GBS方法越来越多地应用于SGS和基因流分析[8.9.1011].GBS方法可以获得大量的SNPS,使我们能够在非常精细的尺度上解析遗传多样性的模式和空间结构[12].与其他分子标记相比,GBS方法非常适合在没有参考基因组的情况下揭示非模式物种的遗传多样性、基因分型和遗传结构[13].与传统分子标记相比,利用大型GBS数据集进行生物地理研究可以极大地提高准确性和提供更高的分辨率,特别是在观察群体遗传结构的细微变化方面。

Tetraena樟子松的的格言。属于Zygophyllaceae家族的(TM)是一种濒临灭绝的物种。它仅在中国内蒙古的阿拉邦鄂尔多斯地区分发,其栖息地由于年降雨量极低,TM依赖于其良好的根源而被定义为生态脆弱的地区。在这些地方可以茁壮成长并获得考虑到对干旱和冷漠以及防风和沙子固定的重视。然而,由于伐木过度的伐木(用于木柴),过度吸引,城市扩张,工业发展,煤炭开采和天然气勘探,近几十年来,TM的TM数量显着下降。TM面积减少225.2公里2(从629.5公里21990年到404.3公里2(2010年)减少了35.8%,减少的面积主要转化为矿区、沙地、农田和城镇[14].目前,TM已被列为中国一级保护植物。以前的研究主要集中在生殖特征上[1516]、解剖学、植物插枝[17,化学成分[1819]、生态生理适应[20.],景观模式[14,采矿的影响[21]耐盐和耐旱性基因[2223]、遗传多样性分析[242526等等。从分子生物学和生态学的角度对其进行深入研究,对于研究其种群结构和濒危机制具有重要意义。因此,研究TM种群的遗传结构和基因流动对于该物种的保护和该地区的生态系统具有重要意义。作为沙漠生态系统中濒危物种保护研究的代表性材料,TM具有以下优势:1)分布有限;2) TM分布区生物群落结构相对简单,以TM为优势种;3) TM地区的城市建设历史可以提供明确的知识,即人类活动如何对该地区产生潜在的影响。

了解该植物遗传变异的地理格局、种群结构和基因流动对其有效保护具有重要意义。本研究利用简化表示测序技术(SuperGBS方法)对TM群体在整个地理分布范围内的遗传多样性、结构和基因流动模式进行了评估。基于全基因组SNPs分析,揭示了城市化、明显水文地质障碍(如黄河、卓子山)下TM的基因结构和基因流。此外,本研究还对TM种群的生物地理格局进行了分析,并发现了其形成的几个可能因素。此外,我们还评估了基于大规模空间遗传结构的“距离隔离”。最后,根据研究结果,提出了更好的保护和后续管理的建设性建议。

结果

snp的发现、基因型和群体遗传多样性

利用Illumina Hiseq Xten、PE150平台对120份TM材料进行测序,经过一级质量过滤,共获得9813376270条reads, 133.45 Gb clean reads,平均每次测序1.11 Gb reads。比对结果显示,所有样本的平均测序深度为104.17×,覆盖率为77.89 ~ 89.66%。用最小的初始质量滤波器集,我们得到40931个SNPs。经过严格筛选(标准:缺失率< 0.2,MAF≥0.01,DP > 4),获得了38,097个SNPs基因分型数据,并计算了几个遗传多样性值。结果表明,在120个个体中,Ne的变化范围为1.020 ~ 2,平均为1.616;Ho和He的水平范围分别为0.067 ~ 0.933和0.019 ~ 0.500,平均分别为0.446和0.348。PIC值从0.019变化到0.375,平均为0.274(表1),共有35,414个(92.95%)snp的MAF大于0.2,高度多态性(MAF > 0.30)为18,800个,占数据集的49.34%,核苷酸多样性(π)在0.019 ~ 0.502之间变化,平均为0.349。每个种群中,HN种群的He、Ne、PIC和π值最高(平均分别为0.341、1.608、0.269和0.354),而SZS种群的He、Ne、PIC和π值最低(平均分别为0.337、1.599、0.265和0.349)。上述数据表明,TM总体上具有中等水平的遗传多样性。在不同群体中,HN群体的遗传多样性高于其他7个群体。遗传多样性数据和精细地理尺度分析表明,在TG分布区,HN群体处于南北交点的中间位置。这是因为TM分布区常年北风,黄河自南向北流,推测HN群体很可能接受了大量来自其他群体的花粉或由种子介导的基因流动。此外,HN群体位于TM国家级自然保护区,因此HN群体的遗传多样性水平高于其他群体,这一结果与Ge等人的结果一致[25].相反,深圳人口位于最南端的TM黄河以西的分布地区,分布地区毗邻HuiNong地区几大工业园区和回填区露天煤矿,煤矿和工业发展造成深圳人口的分裂和破坏当地的栖息地。这一结果可能表明,由于受到人类活动的严重影响,SZS种群的遗传多样性可能正在缓慢减少。

表1每种人群的个体和遗传多样性统计数,观察到杂合子(HO),预期杂合子(HE),多态性信息含量(PIC),有效的等位基因数(NE),核苷酸多样性(π)

种群结构与系统发育分析

为了解所有TM个体间的群体遗传关系,采用ADMIXTURE (version 1.3.0)软件进行遗传结构分析,k值代表分析过程中所有120个TM个体的聚类数,并根据CV选择最优k值。在本研究中,CV范围为0.436 ~ 0.575(图。1a).我们主要关注两个case (K-value = 2和K-value = 3),因为它们清楚地显示了这8个种群的主要结构。当CV为0.436时,最优K = 2,表明来自8个群体的120个TM个体被分成两组的概率最高(图1)。1b)一组由QLS、TST、WJM种群的所有个体和HN种群的7个个体组成,另一组由WD、MHG、SDQZ、SZS种群的所有个体和HN种群的8个个体组成。对地理位置进行对比分析,以乌海市城区为界划分两组,HN人口分布在乌海市海南区附近,其位置在TM分布区南北交汇的中间地带,同时,城市扩张和人类活动也导致了TM人口的一定程度的碎片化。在该尺度下,随着K值的增加(K = 3), 8个种群的120只TM个体均分为3组(图1)。1b),第一组由所有QL,TST,WJM剩余的单个簇组成(图3中的蓝色)。1b),第二组包含4个居群(WD、MHG、HN、SDQZ 13个个体)。第三组主要是SZS和SDQZ的2个个体。在地理分布格局上,第1类个体主要分布在乌海市区北部,第2类4个种群主要分布在乌海市区周边。第三组由乌海市区南部的两个种群组成。虽然也存在大量的基因型混合,但不同群体间存在一定的遗传结构,根据实验群体在空间上与主要地理特征的对应关系,确定K = 2为最合适的遗传聚类数。

图。1
图1

人口结构120Tetraena樟子松的来自8个不同地理位置的个体。一个交叉验证(CV)错误表明120Tetraena樟子松的个体分为2个遗传群体。bK = 2, K = 3的种群结构分析。每个个体用一条竖线表示,竖线被K个颜色的部分分割,这些部分代表了每个聚类的成员可能性。人口代码与表中显示的代码相同2

为了补充混合物分析并更好地了解遗传结构,我们的PCA分析是基于在所有120 TM个人中获得SNP。选择PCA的原因是,它可以检测群体之间的细度遗传结构,即使这些人群之间存在广泛的基因流动[27].PCA分析通常证实了用k = 2获得的遗传结构的模式。我们的结果表明,两个主要成分占总变异性的2.19%(PC 1)和1.67%(PC 2)(图。2).在PC1处,120个TM个体可分为2个显著群,一个由QLS、TST、WJM群体的所有个体组成,另一个由HN、WD、MHG、SDQZ和SZS群体的所有个体组成。第一组(QLS、TST、WJM)个体表现出较低且为负值;相反,另一组个体表现出积极的价值观。在pc2下,120个TM个体大致分为3个群体:一个群体包括QLS、TST、WJM群体的所有个体;二是只由SZS种群的个体组成;三是WD、MHG、SDQZ、HN个人。PCA分析的结果与ADMIXTURE分析的结果相似,说明组间存在明显的差异。此外,与其他种群相比,SZS个体高度离散化表明该种群具有更强的异质性,可能受到严重的干扰。通过调查研究和抽样,发现深空区位于黄河与国道之间,靠近惠农地区露天煤矿工业园区和回填带。 Judging by this, it is a small population separated from early urban sprawl and industrial development, combined with our PCA data, this result further supported our hypothesis that SZS population was most disturbed by human activities.

图2
figure2

聚类的Tetraena樟子松的基于主成分分析(PCA)的群体。每个点代表根据收集站点彩色的个体

为了更好地可视化样本分布和关系,我们构建了120个TM个体的系统发育树(图1)。3.).在种群内,除了HN外,每个种群的个体都聚集在一起,但不同种群之间存在明显的遗传界限。15个HN个体分为两部分,分为不同的支系:9个人的HN人口和MHG人口聚集在一起,其余的6个人的HN人口聚集一个进化枝,ql,结核菌素,WJM紧密并组成一个大型集群,WD和SDQZ聚集在一起(但几个别位置交换,如个体SDQZ8、个人WD6)。15个sz群体个体分别聚集在一起,SDQZ2单独形成一个分支,可见,大部分遗传变异主要发生在TM群体之间。此外,HN种群被划分到不同的分支,提示存在基因渗入。

图3.
图3

基于遗传距离矩阵的邻居连接系统发生树表示120Tetraena樟子松的个人

人口结构,主成分和系统发育关系表明,现有的8个TM种群分为两组,具有高遗传分辨率。Zhi等人。[26通过12微卫星SSR评估了TM群中TM群中的遗传结构,其结果显示出在群体中未检测到可区分的遗传簇。然而,我们的研究发现了明显的遗传群和迹象,即TM人口在38,097个SNPS基因分型数据的基础上开始分化。我们还可以假设检测到的网站数量增加(38,097 vs 12 SSR),发现了更细微的遗传结构。比较PCA具有精细地理规模分析,乌海市区是TM人口的南北边界。

遗传分化和基因流动

虽然系统发育关系和种群结构分析表明,TM居群明显分为两类,但令人惊讶的是,我们发现居群间的遗传分化水平很低,而基因流动水平很高。8个居群的遗传分化系数(Fst)在0.010 ~ 0.026之间,120个TG个体的遗传分化系数平均值为0.020(表1)2).莱特(28浮置板轨道的价值)认为,如果数量是0和0.05之间,它将表明没有种群之间的遗传分化,浮置板轨道值在0.05和0.15之间,如果是中度分化,如果置值在0.15和0.25之间,那么它是高度分化。在这种情况下,8个未分化的TM群体在我们的实验中应该被理解为一个整体。我们在遗传分化方面的研究结果与Ge等人的研究结果一致。24和Zhi等人[26].基因流量在我们研究中的8个种群之间的9.750至39.169(平均12.25)不同(表2).根据Wright [28],将纳米分为三个等级:高(≥1.0)、中(0.250-0.99)和低(0.0-0.249)[29],当Nm >和1存在时,居群间存在一定的基因流动,表明花粉或种子介导的基因流动较高。在以往的研究中,通过比较ATPB-RBCL.在TM的叶绿体DNA的非编码间隔区,Ge等显示了高水平的遗传分化(Fst为0.38-0.90)和中等水平的基因流(Nm为0.04-0.71)[26].与此相反,基于38,097个SNPs,我们发现个体和群体之间存在较强的基因流,几乎没有遗传分化。黄河、蒙谷山、卓子山等8个居群间的基因流动强度较高,表明黄河、蒙谷山、卓子山等地的花粉运动和种子传播不受影响。

表2不同居群间的遗传分化系数和基因流。下三角为群体间遗传分化系数(Fst),上三角为群体间基因流

并对不同群体间的基因流动方向进行了估计。结果表明,在5种推测模型中,“北向南迁移模型”的概率最高3.(基于贝叶斯因子和边际似然)。虽然基因流动的数量表明不同种群之间存在着高水平的基因流动,但从北向南迁移模式来看,WJM种群可能是一个祖传种群,在盛行风的作用下进一步向南传播。

表3给出模型的数据的对数概率(边际似然,基于贝塞尔近似评分)和相应的贝叶斯因子。最可能模型考虑的是南北向模型

遗传距离与地理距离之间的相关分析

要了解地理距离对人口的影响,我们计算了Mantel测试,并且在8个种群的地理距离和遗传距离之间没有检测到显着的相关性(r= 0.358, P (rxy-rand > = rxy-data) = 0.094)(图。4.).虽然两个最遥远的人群之间的距离超过118公里,但是一些人口被黄河和卓氮山分开,“距离(IBD)隔离”型号在我们的研究中仍未发现。细地理规模分析的遗传距离的结果表明,地理距离不是影响TM现有分布模式的确定因素。即使栖息地碎片可能导致距离隔离[30.,但大多数植物的花粉流可以作为一种强大的凝聚力[31],因此,高基因流可能减弱这种隔离效应。

图4.
装具

8 .遗传距离与地理距离无显著相关Tetraena樟子松的是通过曼特尔试验发现的rP (rxy-rand > = rxy-data) = 0.094。P (rxy-rand > = rxy-data) =正自相关概率

讨论

空间遗传结构被认为是人口短期演变的关键因素[32].它是植物特征与生态因素之间相互作用的结果,它可能受到人类干扰,人口的历史事件,自然选择等因素的影响。对于分布范围窄的物种,有限的基因流动是小规模空间遗传结构的主要影响因素。基因流动有限的物种容易发生单个聚集的现象,从而形成人口的空间遗传结构。TM是Zygophylaceae的单调型属,典型的狭窄分布的流动物种,生活在一个非常敌对的环境中。它是其分配领域的主导物种,TM人口的数量和结构在该地区的整体生物多样性和生态系统中起着重要作用。然而,通过对基因组数据的微量分析,通过Ge等人进行的先前研究迄今尚未解决遗传结构和相关的TM人群相关性的主要影响因素。[2425和Zhi等人[26]仅利用少数分子标记对现有群体的多样性和初步遗传结构进行了分析。在本研究中,我们使用简化表示测序技术(Super-GBS方法)对所有的TM群体进行分析,样本的平均测序深度为104.17×。其他相关研究已经证实,如果测序深度超过5倍,将保证基因结构和基因流分析的准确性[3334].

通过对核基因组数据的分析,我们发现该物种存在一定程度的遗传多样性。本研究的几个遗传多样性参数表明,无论将8个TM居群视为一个整体,还是将其视为单独的居群,研究结果仅显示出中等水平的遗传多样性,这与Zhi等人的结论有很大不同。26].地理分布是影响植物物种遗传多样性的因素之一,分布范围广的物种往往具有较高的遗传多样性水平[35].更重要的是,我们的数据显示,TM分布区域南北交叉口中人口(HN)的遗传多样性水平高于边际人群(例如,SZS人口)。HN人口是北方和南部群体之间的遗传交换中级人群,并且收到了更多基因流动介导的花粉和种子。相反,SZS人口是位于TM分布区南端的边际人口。SZS人口的低级多样性表明,由于人类活动(煤炭开采造成的栖息地破坏,工业污染,过度伐木造成的栖息地破坏)严重扰乱。此外,人口边缘的个体更可能被随机事件杀死,导致这些个体携带的基因丧失,从而减少了人口的遗传多样性。因为其他人口的TM远离城市,他们经历了相对较小的干扰。根据生态学理论,一般来说,预期狭窄分布物种的小群体表现出低水平的遗传变异,但群体的遗传分化较高[25].因此,除了自然保护区的核心区,自然保护区外的小种群需要更多的保护。

这里介绍的人口遗传结构和基因流动的证据可以提供不同的洞察力和以前未记录的微妙遗传结构,用于了解TM人群的当前分布模式。人口结构和PCA分析表明,现有的8种群体凭证基于大规模测序数据分为两组,结果与先前研究的结果不同,表明没有表观遗传结构[26].一般来说,黄河是许多物种分布在其流域的天然屏障,但令人惊讶的是,这两个类群并没有被中国第二长河黄河所限制。而从地理分布上看,乌海市及其周边工业区则是这两个群体的分界线。此外,在种群结构和系统发育树中将HN种群的个体划分为不同的群体和聚类,与地理分布模式相对应,HN种群位于狭长分布区的中部。结果表明,HN群体具有较高的遗传渐渗性,与其他群体的交流更为频繁。

对8个TM群体的Fst和基因流进行了测定,结果表明:8个TM群体间无遗传分化,且基因流水平极高(Nm为9.750 ~ 39.169)。黄河、蒙谷山、卓子山等地质地貌对该物种的基因流动没有明显的阻碍作用,推测正是这种高水平的基因流动维持了该物种目前的中等多样性水平。此外,在种群结构中,在所有种群中均观察到大量的外加剂。一些理论声称,混合,反映等位基因共享,可能导致不完整的血统排序的历史邻近种群[36].也建议所有TM个人历史上很有可能连续分布非常大的基因流动人口众多连接,在如此强烈的基因流的情况下,如何理解遗传结构和PCA分析的结果(现有的TM人口分为两组),显然,乌海市的发展和附近工业区的增多在一定程度上削弱了南北种群之间的基因交流,人类活动的干扰是近几十年来最直接、最主要的影响因素[21],受限的基因流动是群体遗传结构形成的主要原因,群体之间或个体之间的基因流动越受限,群体的遗传结构越突出[37].

通过迁移模型评估基因流动的方向。根据我们的数据,北部到南部迁移模型的基于边际可能性和五种推测模型中的贝叶斯因子的概率最高(表3.),这说明北方种群(WJM种群,在调查研究中,我们发现WJM种群的分布面积和个体数量最大)可能是历史上的祖先种群,并随盛行风向南传播。花粉介导的基因流动受到授粉昆虫迁移距离的限制,再加上重力,风也不能将种子长距离传播,因此,基因流动的主要传播方式是短距离逐步传播。虽然根据平均12.25的基因流量可以将8个种群视为一个大种群,但这是种群扩张到稳定栖息地后长期基因交换的结果。此外,在没有干扰的情况下,近距离的基因流动可以通过长期的进化使分布较窄的种群达到动态平衡,但一旦干扰出现,就有可能加速遗传结构的生成。此外,黄河历史上频繁发生洪涝、改道和向下游泛滥平原流动,可能对人口的破碎化和扩散产生了影响。另一方面,洪水不仅导致许多栖息地被淹没,但在同一时间,种子带过河或帮助种子传播到新的地区。因此,与自然因素相比,城市扩张和工业化对邻近迁移的基因流动的影响可能更为显著。

为了探讨不同源种群的物种的空间遗传结构,搭配测试通常用于验证物种是否符合IBD的模型,并分析其遗传距离与空间距离​​之间的相关性[38].Mantel检验结果表明,8个TM居群的地理距离与遗传距离均无相关性,这与我们检测到的高水平基因流相一致。作为传粉植物与狭窄的分布面积,所有8 TM人口相似甚至相同的生态环境,生态因素造成的种群之间的遗传分化不明显,和内部遗传距离和空间距离之间的相关性不显著。在过去的研究中,TM的高胚珠败育率和低结实率等生物学特性被认为是主要的威胁[1539),其他威胁包括城市扩张、工业发展和污染、栖息地碎片化,预计将加剧基因结构的形成和生物多样性的下降。事实上,片段化和扰动可能会减少斑块内种群的有效大小,增加种群间的遗传分化[40].城市化可以打破曾经连续的人口,使人口斑块分散在城镇周围[41].其他相关研究表明,乌海市是一个工业化城市,城市化历史较短(约60年),其工业主要是煤基能源产业[42相反,TM作为“活化石”植物在乌海地区已经存在了数千年,其他研究表明乌海地区的煤炭资源分布与TM有相当大的重叠[21].因此,煤矿产业的发展和城市化过程逐渐分裂了TM栖息地,人类干扰诱导的栖息地碎片影响了TM人口的遗传结构。保护生物学同意,较大的人群存活更长时间,与整体分开的小种群可以很容易地缩小或甚至消失,这些物种都检测到。

结论

结合遗传变异、基因流、群体遗传结构和IBD分析,可以认为TM群体现有的遗传变异和空间遗传结构是城市化和工业化快速发展的结果。虽然TM人口保持一定程度的遗传多样性和高水平的基因流,当前人口显示微妙的空间遗传结构,乌海市是中间的北部和南部TM人口,在某种程度上,密集的城市人口可以影响传粉者的路线,昆虫介导的基因流动经过数代后形成了现在的遗传结构,这是受人类活动严重干扰的TM种群开始逐渐形成遗传分化的信号。与以往的研究结果相比,本研究的遗传多样性和群体结构的研究结果为TM的管理和保护提供了新的视角,可为TM的管理和保护提供有效的信息。为避免遗传退化,保持TM种群数量,提出以下保护措施:(1)严格禁止在TM分布区开采露天煤矿,禁止在TM分布区建立新的工业区。(2)应将8个种群作为一个整体进行保护,作为北方种群和南方种群之间的桥梁和纽带。同时,应持续监测和保护HN种群。此外,由于这些种群具有边缘效应,那些靠近城市和工业区的种群也需要得到良好的保护。(3)开展种质资源的收集、种子库的建立和移栽实验是扩大TM群体的必要条件。此外,作为一种昆虫传粉的植物,对传粉者也应给予足够的重视。

方法

样品收集和DNA提取

本研究在取样前,我们全面调查了TM的地理分布,从现存的8个居群中采集了144只TM个体(居群地名的简写见表)1).样品采集由中国内蒙古自治区西鄂尔多斯国家自然保护区管理局批准。为避免无性系取样,每个种群随机选取18株,每株植株之间最少距离为50 m。北京林业大学张志祥教授根据《中国植物志》的记载对样品进行了仔细的鉴定,并在北京林业大学植物生物系标本室保存了一份凭证标本,登记号为BJFU-TM005。采集144株健康叶片,在野外用硅胶直接干燥,然后带回实验室,在−80℃冷冻,直到提取DNA。

在制造商的介绍之后,通过DNASECURE植物套件(天根BIOTECH,北京,CHN)进行每个人的DNA提取。通过琼脂糖凝胶和纳米玻璃测试DNA质量和浓度后,我们选择了15个样品,每种人群的DNA质量最高为我们的实验样品。

文库准备和测序

我们采用修改的GBS方法(SuperGBS,遵循Qi等人。[43])构建图书馆。简而言之,通过Psti-HF和MSPI(新英格兰Biolabs,NEB)在37℃下用Psti-HF和MSPI(新英格兰Biolabs,NEB)来消化从每种单独的中提取的DNA,然后在75℃下孵育2小时。通过T4 DNA连接酶(NEB)分别在PSTI切位点和所有样品的MSPI切位点连接条形码适配器和常见衔接子,在22℃下连接2小时。使用改进的磁珠的回收系统除去小于300bp的片段。通过PCR使用高保真酶扩增回收的片段,在测序文库之前,通过Qubit2.0测试PCR产物的浓度,应大于5 ng / ul。使用Illumina Hiseq Xten,PE150平台进行测序最终图书馆。

清除原始读取和SNP/indel调用

为了确保分析的准确性,“FastQC”(v. 0.11.4) [44]用于测试原始读取质量。raw reads序列的适配器和条码被STACKS (v2.1)中的process_radtags程序清理[45软件包。限制性位点序列,碱基质量< 20;最后5 bp的原始读取更可能包含错误被删除使用FASTX_trimmer程序包(主要参数-f-l)在FASTX工具包(v0.0.1 4) (http://hannonlab.cshl.edu/fastx_toolkit/).通过以上步骤,可以获得干净的读取数据。由于公共数据库没有完整的TM基因组信息,更没有接合蕨科近缘种的基因组数据可供参考。在这种情况下,GBS参考的从头生成按照以下方法构建[43].使用bowtie2 (v2.3.4.1)软件(主参数-maxins 300 -no- discondant -no-mixed)对GBS参照基因组进行Clean Reads比对[46],然后应用GATK (v3.8-1)软件统一程序(主要参数-dcov 1000-GLM BOTH)进行基因分型[47]来预测样品中的SNP&INDEL位点。利用GATK软件的selectvariant程序对预测结果进行筛选(关键参数:- restricelesto biallelic-select " QD > 10.0 ")。为了降低检测到的SNP indel的错误率,我们使用软件vcftools (v0.1.13)(主参数-maf 0.01 -minDP 4 -max-missing 0.8)对得到的SNP分型结果进行过滤。过滤条件如下:(1)读支持度(总深度,DP)不小于4;(2)剔除较小等位基因频率(MAF) < 0.01的位点;(3)剔除SNP分型缺失率高于20%的位点。

遗传多样性分析

几种群体遗传学将描述遗传变异的一般统计数据由R包Genepop(版本1.0.5)估算如上所述[48].平均等位基因数(Na)、有效等位基因数(Ne)、观察杂合度(Ho)、期望杂合度(He)、多态信息含量(PIC)可按公式计算[49].Vcftools软件(版本0.1.14)[50]来计算核苷酸多样性(π)。

种群结构、系统发育树和主成分分析

为了进一步阐明8个TM群体的遗传结构,我们使用PLINK(1.9版)软件(主参数-独立成对50 10 0.6,0.6是r2阈值)对得到的SNP进行过滤,选择没有紧密连锁的SNP,然后使用ADMIXTURE (version 1.3.0)软件[51为了估计遗传结构,预定义的遗传簇(K)设定为2至10,选择10种不同的模型进行重复分析10次。根据交叉验证误差(CV)以掺入分析确定的最佳k。

为了更好地理解和描述遗传结构,通过Plink2软件(版本:2.0)通过主成分分析来分析所获得的SNP标记(版本:2.0)[52]获得具有最大影响的两种特征向量。

系统发育树是代表个人之间的近或远的关系的树枝结构,用于进一步阐明样品和簇之间的遗传距离。作为第一步,每个单独的SNP标记结束,如果缺少相应的轨迹,则使用 - 代替。邻居加入方法用于构建所有120个个体的系统发育树,TreeBest软件(v1.9.2)[53[用于计算距离矩阵,通过引导方法测试了系统发育树的可靠性,用1000重复。

遗传分化与基因流模式推断

采用R软件的基因流行程序(Version1.0.5)分析所有个体各SNP位点的Fst。分析了8个群体间的基因流水平,并采用公式Nm = (1-Fst)/4Fst对参数Nm进行了评价。利用MIGRATE (https://peterbeerli.com/migrate-html5/index.html),根据Beerli & Palczewski [54和布兰科-贝西尔&巴克林[55].根据该地区的水文和盛行风,选择了基因流动方向的估算模型。我们假设了五种可能的模型:(i)相邻的,迁移只发生在相邻种群之间;(ii)乌海市北部3个种群(WJM、TST、QLS)完全迁移,南部4个种群(SZS、SDQZ、MHG、WD)完全迁移,以乌海市北部和南部为边界,中间HN种群为桥梁;(iii)南北向,该地区盛行风的方向(花粉和种子被风传播);(4)南向北,该地区黄河的流向(种子可能沿黄河散布);(v) panmixia,所有的样品被认为是一个整体种群(传粉者的移动是随机的)。对于每个模型,使用边际似态和贝叶斯因子估计可能的迁移方向和具体的概率,记录的链步数设置为20万。

遗传距离与地理距离之间的相关分析

为了了解来自不同群体的遗传分布和Tg的空间位置之间是否存在相关性,使用Genalex V6.5进行Mantel测试[56有10000种排列。

数据和材料的可用性

植物材料采自TM地理分布的自然种群。原始fastq读取文件可以访问在NCBI序列读取档案(SRA),登录号:生物工程:PRJNA601311;BioSample: SAMN13870224。

缩写

SNP:

单核苷酸多态性

何:

观察到的杂合性

拿拿淋:

平均等位基因数

不:

有效等位基因数

他:

预期的杂合性

主成分分析:

主成分分析

照片:

多态信息含量

加:

轻微的等位基因频率

GBS:

Genotyping-by-sequencing

参考

  1. 1.

    陈建平,李建平。植物扩散生态系统的空间、时间和复杂性。生态学报,2011,30(3):457 - 464。Mov生态。2014;2(1):16。

    谷歌学术

  2. 2.

    Vranckx Guy,Jacquemyn H,Muys B,Honnay O. Meta分析木质植物的易感性,通过栖息地破碎损失遗传多样性。保守生物。2012; 26(2):228-37。

    PubMed谷歌学术

  3. 3.

    Kozakiewicz CP、Burridge CP、Funk WC、Salerno PE、Trumbo DR、Gagne RB等。城市化降低了山猫的基因连通性(猞猁鲁弗斯)在种群内和种群间空间尺度上。摩尔生态。2019;28(23):5068 - 85。

    PubMed谷歌学术

  4. 4.

    LAPOINT S,BALKENOL N,HALE J,Sadler J,Van der Ree R.城市地区的生态连接研究。Funct Ecol。2015; 29(7):868-78。

    谷歌学术

  5. 5.

    Elshire RJ, Glaubitz JC, Sun Q, Poland JA, Kawamoto K, Buckler ES等。高多样性物种的一个稳健、简单的基因分型测序(GBS)方法。《公共科学图书馆•综合》。2011;6 (5):e19379。

    中科院PubMedpmed中央谷歌学术

  6. 6.

    Baird NA, Etter PD, Atwood TS, Currey MC, Shiver AL, Lewis ZA等。使用RAD标记快速发现SNP和遗传作图。《公共科学图书馆•综合》。2008;3 (10):e3376。

    PubMedpmed中央谷歌学术

  7. 7.

    Altshuler D, Pollara VJ, Cowles CR, Van Etten WJ, Baldwin J, Linton L等。由简化的散弹枪测序产生的人类基因组SNP图。大自然。2000;407(6803):513 - 6。

    中科院PubMed谷歌学术

  8. 8.

    Mondon A, Owens GL, Poverene M, Cantamutto M, Rieseberg LH。测序数据中基因分型揭示阿根廷向日葵的基因流动。另一个星球达成。2017;11(2):193 - 204。

    PubMedpmed中央谷歌学术

  9. 9。

    Massatti R,Doherty KD,Wood Te。解决中立和确定性贡献对基因组结构Syntrichia Ruralis.(苔藓植物科)为旱地恢复提供繁殖源。Conserv麝猫。2018;19(1):85 - 97。

    谷歌学术

  10. 10。

    Vidal MC, Quinn TW, Stireman JO, Tinghitella RM, Murphy SM。地理位置比寄主植物的使用对一种多面体昆虫的种群遗传结构更为重要。摩尔生态。2019;28(18):4317 - 34。

    PubMed谷歌学术

  11. 11.

    Mizuno N,Yasui Y.基因流签名在植物碎片的S-Allele地区。BMC植物BIOL。2019; 19(1):125。

    PubMedpmed中央谷歌学术

  12. 12.

    Dittberner H, Becker C, Jiao W, Schneeberger K, Hölzel N, Tellier A,等。通过RAD-seq分析,揭示了阿拉伯漫滩植物干草转移生态恢复的优势和潜在缺陷。摩尔生态。2019;28(17):3887 - 901。

    PubMed谷歌学术

  13. 13.

    Shafer Aba,Peart Cr,Tusso S,Maayan I,Brelsford A.小麦CW,等。Rad-SEQ数据的生物信息处理显着影响下游群体遗传推理。方法ECOL EVOL。2016; 8(8):907-17。

  14. 14.

    关键词:景观格局Tetraena樟子松的受乌海人类骚乱的影响。中国:内蒙古大学硕士论文;2012年。

  15. 15.

    王颖,马辉,郑荣。滇青鱼繁殖特性的研究Tetraena樟子松的的格言。Acta Bot Boreal Endidation Sin。2000; 20:661-5。

    谷歌学术

  16. 16.

    徐Q,江CQ,刘SR,GUO QS。濒危植物授粉生态研究Tetraena樟子松的人口。森林》2003;16(4):391 - 7。

    谷歌学术

  17. 17.

    周ZG,刘GH,杨立LX,Shi XG,罗F.硬木切割生根特征的研究Tetraena樟子松的的格言。中国沙漠,2009;29(3):519-23。

  18. 18.

    Shi G,Ding L,Liu Q,唐S,段H.化学成分包含在Tetraena樟子松的.中国钟尧志。2012; 37(11):1579-80。

  19. 19。

    吴Z,魏W,徐H,郑L,MA C,王Y.从叶子中的成分Tetraena樟子松的对CdCl2损伤的hek293t细胞的保护作用。[J] .自然科学进展,2019;

    中科院PubMed谷歌学术

  20. 20.

    Shi SL。生态生态适应机理研究及危及机制Tetraena樟子松的Maxim在不同的栖息地。中国:内蒙古大学博士论文;2009年。

  21. 21.

    王伟,郝伟,边振,雷松,王鑫,桑松,等。煤矿开采活动对环境的影响Tetraena樟子松的在乌海,内蒙古,中国 - 一种地球化学的观点。int j煤层。2014; 132:94-102。

  22. 22。

    王Y,李米,吴W,吴H,徐y。AP2 / ereBP基因TMAP2-1的克隆与表征Tetraena樟子松的.中国公牛机器人。2013; 48(1):23-33。

    中科院谷歌学术

  23. 23。

    陈乃敏,冯建军,宋斌,唐松,何建强,周永军,等。盐胁迫和PEG胁迫相关基因的转录组测序及鉴定Tetraena樟子松的的格言。树木。2019;33(6):1639 - 56。

    中科院谷歌学术

  24. 24.

    Ge x,yu y,zhao,陈h,qi w.濒危内蒙古特有灌木的遗传变异Tetraena樟子松的格言(蒺藜科)。Conserv杂志。2003;111(3):427 - 34。

    谷歌学术

  25. 25.

    acta optica sinica, 2011, 32(5): 689 - 693 .葛欣,黄诚,黄伟,洪凯,等。濒危和特有灌木保护的遗传与系统地理学Tetraena樟子松的(Zygophyllaceae)在中国内蒙古。BMC Genet。2011; 12:1。

  26. 26.

    Zhi Y,Sun Z,Sun P,Zhao K,Guo Y,Zhang D等。遗传和碎裂的灌木中储存了多少遗传变异Tetraena樟子松的格言?同行j . 2018; 21 (6): e5645。

    谷歌学术

  27. 27.

    Jombart T,Devillard S,Balloux F.主成分的判别分析:一种新方法,用于分析基因结构群体。BMC Genet。2010; 11:94。

    PubMedpmed中央谷歌学术

  28. 28.

    自然种群的进化与遗传,自然种群内部和之间的变异,第4卷。芝加哥:芝加哥大学出版社;1978.213 - 20页。

    谷歌学术

  29. 29.

    Govindaraju博士。分散能力与植物基因流水平的关系。oikos。1988; 52(1):31-5。

    谷歌学术

  30. 30.

    赵Y, Vrieling K,廖H,肖M,朱Y,荣J,等。生境破碎化、局部适应性和距离隔离是否是导致野生稻种群差异的原因oryza rufipogon.?摩尔生态。2013;22(22):5531 - 47。

  31. 31.

    Browne L,Karubian J.栖息地损失和碎片通过破坏新棕榈种子分散而减少有效的基因流。Mol Ecol。2018; 27(15):3055-69。

    PubMed谷歌学术

  32. 32.

    吴国强,李士伦,许丽丽。两种不同育种体系和不同倍性水平热带树种的空间结构和遗传多样性。摩尔生态。2004;13(3):657 - 69。

    PubMed谷歌学术

  33. 33.

    何卓,翟伟,文华,唐涛,王勇,陆翔,等。水稻基因组的两个进化历史:驯化基因的作用。公共科学图书馆麝猫。2011;7:e1002100。

    中科院PubMedpmed中央谷歌学术

  34. 34。

    李勇,周刚,马军,姜伟,金磊,张志辉。et al。大豆野生亲缘物的从头组装及其多样性和农艺性状分析。生物科技Nat》。2014;32(10):1045 - 52。

  35. 35。

    Karron JD。受地理限制和广泛分布的植物同属的遗传多态性和自交相容性水平的比较。另一个星球生态。1987;1(1):47-58。

    谷歌学术

  36. 36.

    黄龙,陈杰,曾迈,涌杰,昌CT,Hwang Sy。环境和空间因素对遗传和表观遗传变异的影响Rhododendron Oldhamii.(杜鹃花科)。Tree geneet genomic . 2015;11:823。

    谷歌学术

  37. 37.

    Hardy OJ, Maggia L, Bandou E, Breyne P, Caron H, Chevallier MH.等。10个新热带树种的精细遗传结构和基因扩散推断。摩尔生态。2010;15(2):559 - 71。

  38. 38.

    Moyle LC。遗传分化与17个基因型溶液物种的距离相关。Mol Ecol。2006; 15(4):1067-81。

    中科院PubMed谷歌学术

  39. 39.

    [15]刘广华,周树青,唐磊,任磊。黄龙的生物学特性及危害因素研究Tetraena樟子松的.内蒙古林学院,1993;2:33-9。

    谷歌学术

  40. 40.

    植物生境破碎化的种群遗传后果。生态学报。1996;11(10):413-8。

    中科院PubMed谷歌学术

  41. 41.

    Lee JS, Ruell EW, Boydston EE, Lyren LM, Alonso RS, Troyer JL等。山猫之间的基因流动和病原体传播(猞猁鲁弗斯)在支离破碎的城市景观中。摩尔生态。2012;21(7):1617 - 31所示。

    PubMed谷歌学术

  42. 42.

    张。。濒危物种的种群动态,Tetraena樟子松的在破碎的栖息地。中国:武汉大学博士学位论文;2000.

  43. 43.

    Qi P, Gimode D, Saha D, Schröder S, Chakraborty D, Wang X,等。UGbS-flex,一种新的生物信息学管道,用于在没有参考基因组的多倍体中发现不受指责的SNP:指粟作为一个案例研究。植物生物学学报。2018;18(1):117。

    PubMedpmed中央谷歌学术

  44. 44.

    FastQC:高通量序列数据的质量控制工具;2010.http://www.bioinformatics.babraham.ac.uk/projects/fastqc

    谷歌学术

  45. 45.

    Catchen JM,Amores A,Hohenlohe P,Cresko W,Postlethwait JH。堆栈:从短读序列的建筑和基因分型Loci de novo。G3(Bethesda)。2011; 1(3):171-82。

    中科院谷歌学术

  46. 46。

    Langmead B,Salzberg SL。与Bowtie 2. NAT方法的快速喷射读取对齐。2012; 9(4):357-9。

    中科院PubMedpmed中央谷歌学术

  47. 47。

    马克南(McKenna A, Hanna M, Banks E, Sivachenko A, Cibulskis K, Kernytsky A, et al.)基因组分析工具包:一个用于分析下一代DNA测序数据的MapReduce框架。基因组研究》2010;20(9):1297 - 303。

    中科院PubMedpmed中央谷歌学术

  48. 48.

    Rousse F. Genepop'007:完全重新实现Windows和Linux的Genepop软件。Mol Ecol Resour。2008; 8(1):103-6。

    谷歌学术

  49. 49.

    Botstein D, White RL, Skolnick M, Davis RW。利用限制性片段长度多态性构建人类遗传连锁图谱。张学军。2004;32(3):314-31。

    中科院PubMedpmed中央谷歌学术

  50. 50.

    Danecek P, Auton A, Abecasis G, Albers CA, Banks E, Depristo MA。et al。变体调用格式和vcftools。生物信息学。2011;27(15):2156 - 8。

  51. 51.

    基于快速模型的非亲缘个体祖先估计。基因组研究》2009;19(9):1655 - 64。

    中科院PubMedpmed中央谷歌学术

  52. 52.

    Purcell S, Neale B, tod - brown K, Thomas L, Ferreira MA, Bende D等。PLINK:一套用于全基因组关联和基于群体的连锁分析的工具。张学军。2007;30(3):531 - 531。

    中科院PubMedpmed中央谷歌学术

  53. 53.

    阮娇,李浩,陈智,Coghlan A, Coin LJ,郭勇,等。TreeFam: 2008更新。核酸杂志2008;36:D735-40。

    中科院PubMed谷歌学术

  54. 54.

    在多个采样点间评估泛mixia和迁移方向的统一框架。遗传学。2010;185(1):313 - 26所示。

    PubMedpmed中央谷歌学术

  55. 55.

    Blanco-Bercial L,Bucklin A.浮游动物种群遗传学的新视图:Rad-SEQ分析揭示了北大西洋浮游桡足类北大型浮游县的人口结构,Centropages typicus.摩尔生态。2016;25(7):1566 - 80。

    中科院PubMed谷歌学术

  56. 56.

    Peakall R, Smouse PE。GenAlEx 6.5: excel中的遗传分析。用于教学和研究的人口遗传软件——一个更新。生物信息学。2012;28:2537-9。

    中科院PubMedpmed中央谷歌学术

下载参考

确认

感谢北京林业大学生物科学与技术学院全体教职员工。我们感谢李明宇博士在测绘方面的帮助。

资金

中央高校基本科研业务费专项资金项目(No. 2019ZY32);国家自然科学基金项目(No. 31972948);高校学科引进人才计划项目(No. 111)。B13007)。资助机构在研究的设计、收集、分析和解释数据以及撰写手稿方面没有任何作用。

作者信息

从属关系

作者

贡献

DSB设计研究并收集实验材料,CJ进行研究并分析数据,KHX提供试剂或分析工具,DSB撰写初稿,所有作者均已阅读并批准稿件。

相应的作者

对应到董舒宾

道德声明

伦理批准并同意参与

不适用。

同意出版

不适用。

利益争夺

作者声明他们没有利益冲突。

额外的信息

出版商的注意

Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。

权利和权限

开放获取本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。本文中的图像或其他第三方材料包括在文章的创作共用许可中,除非在材料的信用线中另有说明。如果材料没有包含在文章的创作共用许可证中,而您的预期使用不被法律法规允许或超过允许的使用,您将需要直接获得版权持有人的许可。如欲浏览本许可证的副本,请浏览http://creativecommons.org/licenses/by/4.0/.“创作共用公共领域”豁免书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非另有用入数据的信用额度。

重印和权限

关于这篇文章

通过Crossmark验证货币和真实性

引用这篇文章

程军,高洪,董松。珍稀濒危植物种群遗传结构与基因流动Tetraena樟子松的的格言。通过减少表达序列揭示。BMC植物杂志20.391(2020)。https://doi.org/10.1186/s12870-020-02594-y

下载引用

关键字

  • 遗传多样性
  • 种群遗传结构
  • 基因流动
  • 距离距离
  • Tetraena樟子松的的格言。