跳过主要内容

遗传分化与基因组变异的分析,揭示玉米改善期间重要性区域

摘要

背景

探索遗传分化和基因组变异对杂种优势的利用和复杂性状遗传基础的剖析都具有重要意义。

方法

我们综合来自美洲,非洲,欧洲和亚洲1857年多样玉米种质到investigatetheir遗传分化,使用43252高品质的单核苷酸多态性(SNP)的基因组变化,梳理GWAS和连锁分析策略,探索相关的基因片段的功能。

结果

我们发现了许多群体最近或历史上在繁殖过程中形成的群体。这些图案由以下线条表示:Mo17,Gb,E28,YE8112,Hzs,Shen137,PHG39,B73,207,A634,OH43,Reid黄色凹陷和热带/亚热带(TS)种质。共有85个高度差异的区域,d美东时间在TS和温带群之间鉴定了超过0.2。这些地区占遗传变异的79%,大多数与适应性性状有显着相关。例如,含有SNP标签PZE108075114的区域具有高度分化,并且该区域与开花时间(FT) - 相关性状显着相关,基因组 - 宽协会研究(GWA)在FT的间隔内支持相关定量特质基因座(QTL)。该地区也与之密切相关zcn8vgt1,这被证明参与了玉米适应。最重要的是,197个不同亚population对之间的高度分化区域位于FT或工厂架构相关的QTL内。

结论

在这里,我们报道了700-1000个SNPs是必要的,需要稳健地估计一个自然多样性面板的遗传分化。此外,在玉米种质中观察到13个亚群体,85个TS与温带玉米种质高度分化的遗传区,197个不同亚群体对之间高度分化的遗传区,其中含有一些FT相关的QTNs/QTLs/基因,这些基因由GWAS和连锁分析支持。这些地区预计将在玉米适应中发挥重要作用。

背景

玉米(Zea Mays.L.)在世界各地广泛种植,包括六大洲的70多个国家。1].玉米起源于墨西哥中南部[2]乃至整个美洲传播了几千年才传入欧洲,非洲和亚洲哥伦布发现新大陆[后3.].在这种展开期间,玉米通过自然和人工选择不断改进,以适应不同的环境[4.];开发了许多地形和自交互态[5.],许多高产杂交种已被释放,以满足人类日益增长的需求[6.].

在过去的几十年里,玉米的扩散[3.], 改进 [7.-11.],pedigrees [12.13.和表型变异的遗传基础[14.-16.,为遗传对历史产量增加和杂种优势群体形成的贡献提供了科学证据。以美国玉米种质资源为例,将其分为3个主要杂种优势组:爱荷华州硬茎合成(SS)、非硬茎杂交(NSS)和碘化(IDT) [10.].非洲玉米种质分为三个集群:中美洲人的地架,沿海巴西地体,以及热带品种[17.].中国玉米种质分为五个亚群:包括卢德龙古,TSPT,P组,Reid和兰开斯特[18.-20.].上述研究提供有用的信息对杂种优势利用和遗传基础复杂的解剖特征,但以往的研究中使用的到达了从单一的地理起源和依赖于最小数量的标记,这限制了我们对遗传分化的理解。高通量基因分型策略的发展促进了玉米历史遗传变化的研究[21.-23.].最近,利用基因分型测序(GBS)方法对另一组2815份玉米种质资源进行了研究[12.研究结果表明,本研究不仅提供了丰富的遗传信息,而且还发现了许多与花期相关性状相关的新基因位点。本文共观察到5个亚种群;SS亚群体与NSS亚群体之间的距离较小,与以往的研究和基于育种实践对玉米系谱的了解相比存在轻微偏差[10.22.24.-26].

此外,许多研究报告使用G的基因组变异D美东时间, F)[27].Haag等[28[答案]D美东时间构成了种群间遗传分化的替代方法。然而,传统的F价值已被广泛用于估算植物遗传分化。更高的F.利用284个明尼苏达州玉米自交系在亚居群间观察到的性状[22.,该值大于温带玉米种质间的差异[9.].Romay等[12.结果表明,玉米带经典育种项目的大部分种质资源亲缘关系密切,平均两两F为0.04,大于热带和温带线之间的0.027 [29],地方品种与改良品种间的0.02值。然而,这个值没有超过大刍草和地方品种之间的0.11值[30.然而,以往的研究大多只报道了亚种群间遗传变异的分化现象和程度。高度分化并与假定功能相关的潜在重要基因组区域尚不清楚,尤其是对玉米而言。

本文整合了来自美洲、非洲、欧洲和亚洲的玉米种质资源,包括来自全球16个国家的1857份玉米种质资源,并利用43252个单核苷酸多态性(SNPs)数据集,对玉米的遗传分化和基因组变异进行了深入分析。我们分析了选择固定的全基因组变异模式,揭示了群体结构的细分,确定了亚群体间高度分化的基因组区域,ft相关性状的全基因组关联研究(GWAS)。并与QTL和生物信息学分析结果进行比较,确定在玉米发育和现代杂种优势群体形成过程中可能起重要作用的适应性基因组区域和相关候选基因。

结果

确定偏见

一个给定的子集,并且整个组与所有标记之间的前五个主成分(PC)的平均相关系数示于附加文件1:图S1。子集和整个集合之间的相关系数急剧增加到700的标记数为0.65到0.97的标记数。当标记数字从800增加到1000时,第二次急剧增加,相应增加相关系数从0.97到0.99。此外,当标记数从2000增加到43,252时,相关系数不会显着变化。结果表明,人口结构分析可能足以足以进行1,000个SNP。

基于模型的人口结构

利用均匀的5000NP分布,深入分析了基于混合物模型的算法的1857年摘录的亚群。结果如图1所示。1.当K = 2时,δ K(∆K)峰值最大。1),表明其种质资源可分为热带/亚热带(TS)和温带(TS)两大类。1 bk = 2)。在K = 4时出现第二个峰(K)。1),表明该小组可进一步分为四个亚组:SS, NSS,中国改良引种(MICN)和TS I(图。1 bk = 4)。值得注意的是,MICN是在中国玉米育种的漫长历史中形成的,因为中国的玉米育种家已经开发了许多来自中国地方品种和美国杂交品种的自交系。这些品种与美国自交系有很大的不同[19.].在k = 7时观察到ΔK的第三峰(图。1),表明该群体可被综合分为7个亚居群,每个亚居群包括B73、黄早丝(HZS)、207、Oh43、Mo17、Shen137和一些来自TS区(图1)。1 b k= 7)。每个加入国的详细信息列在附加文件中2:表S1。

图1
图1

基于模型的人口结构细分。”一种表示对Ln(数据概率)的估计。K从K = 2到K = 9。”B.’给出了由隶属系数(Q值)推导出的1857份玉米种质的群体结构。每个水平条表示一个加入,由K个彩色段组成。“SS”是硬茎合成组、“MICN”改良中国引种组、“TS”热带/亚热带组和NSS非硬茎组的缩写

聚类分析

基于修改的欧几里德距离构造邻接树,并且如图2所示。2.1857份植物按起源可分为TS亚群和temtropic亚群。TS分组人口包含525登记入册,其中包括195年到达墨西哥,187年从美国,77年从中国,17从苏丹,10个来自泰国,从加拿大9,9来自坦桑尼亚,6从尼日利亚,3从索马里,3从贝宁、3从赞比亚,3从乍得、2从西班牙,1来自加纳,1从德国,1来自南斯拉夫,和1个来自埃及(附加文件2:表S1)。在TEM嗜亚群包含1332份种质,其可以进一步聚集成四个亚群,SS,NSS,Iodent(IDT)和TS,根据它们的起源和家系。进一步的分析表明,从这四个亚群的种质可聚成13个亚类,具有下列代表性的行:里德黄色马齿,OH43,A634,207,B37,B73,PHG39,Shen137,黄早(HZS),Ye8112,E28,GB和Mo17的(图2).

图2
figure2

1857个玉米品种的邻接树。Mo17是非硬茎(NSS)的代表品种。GB是中国长白花的一个代表品种。E28是鲁东鼓集团的代表线。Ye8112是改良里德集团的代表线。“HZS”是黄早寺的缩写,是唐四平头群(TSPT)的代表线。Shen137是PA集团的代表线。PHG39是来自阿根廷玉米Amargo背景的亲本。B73是硬茎合成(SS)的代表系列。B37、207、A634、Oh43和Reid Yellow Dent分别是不同亚群体的代表品系

主成分分析(PCA)

PCA结果显示了子种群的综合模式,与基于模型的种群结构和聚类分析都有很好的一致性(图2)。3.).1857份材料表现为中度分化,温带种质与TS种质存在部分重叠;来自TS和温带地区的代表性品系差异显著,如来自泰国TS地区的B73和Ki3,而来自邻近地区的品系差异不显著。这可能是由于温带和热带/亚热带植物之间存在较大的渐渗透和只用两个pc进行种群结构分析时主成分分析的功率较低的结果。根据基于模型的结构分析结果,温带亚居群的资源进一步划分为B73亚居群(图3)。3 b)或Ye8112、B37和A634亚居群(图。3 c).基于百分点,大多数线条来自美国和中国(图。3 d和附加文件2:表S1)。此外,基于基于模型的群体结构,TS群体进一步分为Hz,207,OH43,Mo17和Shen137亚步骤,其对应于基于聚类分析的Hz,Gb,Shen137,Mo17和Reid黄色凹陷。(图。3 c).这些亚群体的系谱或来自CIMMYT、墨西哥和其他热带地区的系谱中含有TS系的自交系(图)。3A和D.).此外,许多植物被划分为新的类群,如PHG39、207、A634、Oh43、B37和E28亚群;这些类群的大部分资源来自温带和温带之间的地区(图2)。3.),由于TS基因型渗入温带种质区。

图3
图3

主要成分(PC)的结果。情节'一种”和“B.显示了基于模型的人口结构与PC分析结果之间的比较。情节的C表示PC分析结果与基于改进的欧氏距离构造的N-J树的比较。情节的D.显示原始信息和PC分析结果的对比

遗传多样性概述统计

1857年种质整个面板的种质是中度相似的,具有变化的0.30至0.53(图1中的一对,亲属关系系数超过96.22%。4).平均连锁不平衡距离为30千个碱基(kb),变化范围为20 ~ 50 kb2超过0.1(图。4 b).基于模型的居群结构分析和基因组变异分析结果表明,不同亚居群间存在显著的遗传变异模式。这些模式是由人工选择或自然选择固定的,并导致了在繁殖过程中亚种群的划分。TS亚群体的遗传多样性高于温带亚群体,基因多样性(GDs)分别为0.364和0.284,多态性信息含量(PICs)分别为0.281和0.2311).当与温带亚群中的LD中的较大比例的SNP比较时,在LD中具有较小的SNP验证了类似的趋势(图。4摄氏度).

图4
装具

在整套材料中存在遗传变异的统计概况。”一种这是一幅1857年继承的成对亲属关系图。”B.’显示了不同染色体和整个基因组上连锁不平衡(LD)的衰退程度。”C'显示不同亚步骤之间LD级的比较。”D.'图片染色体上的基因组分化8

表1遗传多样性统计摘要

亚居群之间的基因组分化

由于亚步骤引起的遗传方差比例(D.美东时间)来解释亚群体之间的基因组变异(表2,无花果。4(d),无花果。5.和附加文件1:图S2)。D.美东时间亚群之间的基因组分化的指示的不同图案,范围从0到TS和温带之间0.39(平均0.08),从0到TS I和SS之间0.45(平均0.09),从0到SS和NSS之间0.45(平均0.07)从0到NSS和MICN(平均0.05)0.41,从0到MICN和TS我之间0.38(平均0.06),从0到NSS和TS我之间0.30(平均0.03),和从0到SS之间0.57MICN(平均0.08)。SS和TS我品种更分化的,与具有大的d 332个的基因组区域美东时间(平均水平的两倍)(图。5).此外,250个基因组地区是高度分化的SS和MICN之间,235人TS和温带之间高度分化,92人高度MICN之间的分化和TS I, 51 NSS之间高度分化和MICN,和8 NSS之间的高度分化和TS I, D美东时间的两倍以上的平均水平。最重要的是,85米与d高度分化的区域美东时间TS亚居群与温带亚居群之间的差异超过0.2。在这85个区域中,68位位于植物建筑或与FT相关QTL的区间内,两个地区与其紧密相连vgt1zcn8(附加文件2:表S2和S3)。此外,一些特殊的基因组区域也被发现高度分化。特别地,确定了不同种群对之间的亚种群对和共同区域(图)。5 b).共303个基因组区D值较高美东时间检测到超过0.2,这些地区位于197英尺或工厂建筑相关QTL内。例如,包含标签SNP的区域108075114在TS和温带群之间的不同之处在于,与D相关联美东时间的0.32;该区域位于一个ft相关的QTL簇内,包含侧翼标记PHTi060和bnlg15992:表S3)。

表2 D美东时间亚种群之间
图5
figure5

具有高度分化的遗传区域计数。”一种”示出的基因组区域中的计数为每个亚群对。”B.’显示了不同亚群体对之间高度分化的基因组区域的比较

ft相关性状全基因组研究

ft相关性状的表型与环境呈显著正相关(附加文件1:图S3)。因此,计算用于在三种环境的每个加入的BLUPs,和表型 - 基因型关联进行了分析。为了验证高度分化的靶区域的推定自适应功能,我们使用了FT-相关性状DTT,DTS,和DTP与43252个SNPs作为案例研究执行GWAS。结果表明,一些高度分化的基因组区域用FT-相关性状相关。例如,PZE-108070380的SNP被显著用DTT(相关P. = 7.05 × 10−14),DTP(P. = 2.57 × 10-9)及DTS (P.= 2.12 × 10-8)(图。6.).这个SNP位于zcn8基因,参与了玉米从热带地区向温带地区的迁移[31].SNP pse -108076585与DTS显著相关(P.= 1.43 × 10−11)(图。6.).这个SNP位于vgt1基因,参与玉米适应[32].此外,其他12个SNPs也与ft相关性状密切相关(图。6.),这些snp周围的区域比基因组的其他部分更分化(图。4 d额外的文件1:图S2,附加文件2:表S2)。

图6
figure6

曼哈顿绘图的GWAS结果与花时间相关的特征。红色循环是指花粉的天数(DTP),蓝循环显示到丝绸(DTS)的日子,绿色循环显示到流苏(DTT)。红线显示截止值为5.94(定义为:-log10.(0.05/43252))

讨论

中度snp在解释群体结构划分方面是可靠的

以前的报告比较了不同标志系统的效果,并得出结论,群体细分依赖于标记大小和人口[18.33-35].例如,当在154个近交系的一个关联面板中使用884个SNP时,将超过26.4%的线分配给混合组。该速率高于使用84简单序列重复(SSR)标记识别的20.6%速率[35].847个SNP和89点之间的SSR的效果在254个自交系一个面板相比产生类似的结果[36]他们提出需要更多的SNP来研究人口结构。在这里,我们将划分的平均相关系数与不同标记尺寸的给定子集之间的子集与所有标记的整个集合进行了比较了群体之间的群体之间的平均相关系数;我们使用的SNP在相同样本的面板中改变了500到43,252。结果表明,700个SNP足以可靠地将该面板中的群分开,其前五个PC之间的平均相关系数为0.97,在子集和整套SNP之间。通过将SNP的数量增加到1000(附加文件,平均相关系数可以增加到0.99(附加文件1:图S1)。yu等人。[37报告了适度的遗传多样性,对于样品大小为0.24的样品大小。在此情况下,我们报告了0.29的类似照片,适用于1,857的样本量。yu等人。[37研究表明,要稳健地估计一个自然多样性面板的遗传分化,需要超过1000个SNPs,这一要求超过了本文发现的700-1000个SNPs。因此,更大的样本量有望显著提高群体中细分的检测能力。这些结果与Morin等人报道的结果一致[33,比较了10 - 100个样本大小的亚群体分化。本文报道的结果表明,中等SNP标记数(700-1000)足以在该面板中划分群体结构。

世界玉米自交系群体结构的综合格局

人口结构分析是通过关联分析对复杂性状的遗传基础进行解剖的重要一步[38].这样的分析可能会导致假阳性错误[34].在过去的几十年里,许多研究利用有限的样本量和来源来评估特定种质的种群结构。这些研究独立地提供了关于大约600份明尼苏达玉米种质的亚群体分化的具体信息[22.] Hohenheim的172种Dent种质[39, 400个北美玉米品系[23.],中国367个精英系[19.]和表示TS和温带背景[527线40].本研究整合了来自美洲、非洲、欧洲和亚洲的玉米种质资源,包括来自全球16个国家的1857份玉米种质资源,对玉米亚群体分化进行研究。STRUCTURE V2.3.3鉴定出7个亚群:B73、HZS、207、Oh43、Mo17、Shen137和TS II(图2)。1).这些结果为玉米亚群体分化提供了更多的信息。事实上,利用SSR标记和Illumina MaizeSNP50 Beadchip [22.].HZS (TSPT)、Shen137 (PA源自Pioneer杂交种78599)和TS I亚居群在前人的研究中也得到了鉴定[18.19.41].此外,该研究的研究结果也与已知的章节一致。例如,LH61与MO17共用87.5%的核遗传物质[42],聚为Mo17亚群体,血统成员为0.91(附加文件2:表S1)。这些结果与Lorenz等人报告的结果一致。[42].此外,聚类分析鉴定了更多簇,包括MO17,GB,E28,YE8112,Hz,SHEN137,PHG39,B73,B37,207,A634,OH43和REID黄色凹陷(图。2).这些集群的识别表明,与基于模型的方法相比,我们的聚类分析增加了分辨率对亚步骤的分类,该分析与基于模型的方法相比,这通常识别六个亚步骤,MO1​​7,B73,HZS,OH43,207和SHEN137。例如,PB80和A632分别共有75%和93.75%的B73和B14的核遗传物质[42[分别将这两条线分别聚集成与B73和B14相同的亚群。此集群与Lorenz等人的报告一致。[42].最重要的是,本研究通过聚类分析发现了新的亚群,分别为:GB、E28、Ye8112、PHG39、B37、A634和Reid Yellow Dent。这些品系对应以下杂种优势群体:中国长白羊(GB) [19.,陆东红谷(E28) [41],Pb(YE8112,B37)[19.]源自现代美国杂交种,商业杂交种派生系(PHG39, A634) [10.]和美国长白(里德·黄·登特)[10.], 分别。在这些群体中,中国地兰主要分布在中国东北和西南,这一品种源于北美中西部和墨西哥高地[3.].这些地方品种产生了新的亚群体,并已被广泛应用于玉米育种计划[19.].例如,E28是根据芦大红姑家系与改良引种系杂交而得到的具有代表性的品系[19.].Ye8112是从源自美国的杂交品种“8112”中选出的[41].某些行从这一行,如掖478和488,这是在PB [的杂种优势群成簇衍生19.41].A634源自MN13谱系[22.],在美国杂交玉米育种中高度使用。该线在1970年,1975年,1975年,1975年,1975年和1979年的总体种子要求中的4.2,7.8和3.0%。源自A634 [13.].B37是一个重要的公共线路,在20世纪80年代被广泛用于开发先锋混合动力车[6.].从先驱混合动力选择第二循环线导致新线,其形成由B37表示的亚群。PHG39是一种代表性的近交玉米AMARGO种质线,其已经开发出许多受保护的玉米线。此外,已经考虑用于商业玉米育种的PHG39的几种重要的第一周期重组线[10.].这些结果为玉米育种家在有效利用历史遗传资源的同时保持杂交育种所需的杂种优势模式提供了更明确的信息。

基因组分化和推定功能

亚群体间的基因组分化是群体遗传学的一个基本挑战。玉米原产于墨西哥中部的热带地区,并迅速传播到世界各地较冷的温带地区[32].这种扩散使玉米通过开发允许它在这些环境中茁壮成长的特性来适应局部环境,即FT和工厂架构的变化。这些变化允许玉米在不同的生长季节内达到成熟。有些研究已经记录了一对明智的f在考虑基因组分化的同时在亚步骤之间[9.4344].谢弗和伯纳多[22.的平均配对F一个不同的284级玉米近段面板为0.165;该值在A321和OH43亚次亚次亚次亚次亚次蛋白间至0.325之间的值范围为0.054。Romay等[12.]研究发现,从玉米带的经典育种计划最种质密切相关,平均成对˚F0.04。然而,分化区域和假定的功能仍然知之甚少。此外,维美东时间也被证明是一种测量基因组分化。该参数依赖于基因型而不是等位基因数,并纠正杂合子[27];接近零的值表示很小的差异化,接近统一的值表示几乎完全差异化。因此,D美东时间在本研究中用于评估亚居群之间的基因组变异,分析结果显示亚居群之间存在很强的分化。这种分化归因于在玉米育种实践中,亚群体内目标基因组区域的持续固定和亚群体之间的强隔离。成对D美东时间TS亚种群与温带亚种群之间的差异为0.172),共鉴定出235个高度分化的基因组区域(图。5.).在玉米的长进展期间选择和修复了大多数适应性特性,并修复了热带温带气候的调整[31].这种固定导致TS和温带种质之间的高基因组分化(表1图。23.).有趣的是,85个强烈分化的基因组区域,具有D.美东时间TS亚居群与温带亚居群之间的差异超过0.2。遗传分析表明,这85个区域构成了该面板遗传变异的79%(附加文件1:图S4)。在这些区域中,15个区域与ft相关性状显著相关(图2)。4 d和附加文件1:图S2)。此外,两个重要的QTN与zcn8vgt1(图。4 d),其参与玉米迁移和适应从热带到温带气候[31].此外,66个高度分化区域位于植物构型或ft相关QTL区间内2:表S3)。此外,159个高度分化的基因组区域还查明SS和NSS亚群之间,具有d美东时间超过0.16(图。5.).此外,还识别了位于FT或工厂建筑与工厂建筑相关QTL内的15个区域(附加文件2:表S3)。这一发现与SS和NSS之间的标记距离一致(图)。123.).SS和NSS是美国中使用的两组的两个主要的异性组,其繁殖计划分别由B73和MO17表示。以前的研究还报告了这两组之间的显着距离[23.].此外,还识别出特定亚泊素对之间的其他高度分化的基因组区域,并且这些区域位于与使用不同双重父母群体映射的FT-或工厂建筑有关的特征相关的多个QTL中(附加文件2:表S3)。共303个基因组区D值较高美东时间检测到超过0.2,这些地区位于197英尺或工厂建筑相关QTL中。例如,含有标签SNP的区域在TS和温带亚步骤之间更差异(D.美东时间 = 0.32), and this region was located within one FT-related QTL cluster that contained the flanking markers PHTi060 and bnlg1599. These results indicate genomic regions of interest for the formation of given subpopulations and provide new insight into the dissection of the genetic basis of complex traits.

结论

在这里,我们报道了700-1000个SNPs是必要的,需要稳健地估计一个自然多样性面板的遗传分化。此外,根据基因分型和家系信息鉴定了13个亚居群。在此基础上,鉴定出85个TS与温带玉米种质间高度分化的遗传区域和197个不同亚群体对间高度分化的遗传区域,其中包含一些经GWAS和连锁分析支持的与FT相关的QTNs/QTLs/基因,以及一些已知的相关基因vgt1zcn8与玉米从热带到温带的适应有关的,也包括在这些地区。因此,我们认为这些差异区域将在玉米适应中发挥重要作用。这些结果将为亚群体分化提供丰富的信息,并有助于深入分析复杂性状的遗传基础。

方法

植物材料

目前的研究包括了从世界各地收集的1857份植物资源,包括400份来自美国农业部(USDA)国家植物种质系统的资源[23.], 280号从美国中北部地区植物引种站[45],368来自cimmyt [21., 48源自非洲[17.],中国农业科学院作物研究所(ICS/CAAS)的890。中国种质资源包含两套自交系:一套来自先前建立的核心[46],242个不同的自交系​​,历史上用于中国玉米繁殖,另一个来自研究机构或公司的另一条线。后一种类别包括648个精英自交系,主要用于当前玉米育种[19.].详细信息请参见附加文件2:表S1。

表型评价

在2014年北京(春播)、2014年河南新乡(夏播)和2014年吉林宫竹岭(春播)3个环境下,对1857份供试材料中1176份ft相关性状进行了评价。在每个地点按随机试验设计种植。植株(15株/行)单行播种,每行4米长,间隔0.6米。种植密度为52400株/公顷,采用双组试验。抽雄期、吐丝期和花粉脱落期的相关性状均在50%的植株表现出相应性状时进行记录。采用PROC GLM模型进行方差分析。利用PROC CORR模型计算不同环境下ft相关性状的Pearson相关分析。使用PROC MIXED模型进行最佳线性无偏预测器(BLUP)计算,将基因型、位置、按位置分基因型和重复作为随机效应[47].以上分析均使用SAS软件完成(版本9.3;SAS Institute, Cary, NC)。

基因分型数据集

使用MaizeNP50 Beadchip和56,110个SNP进行基因分型523新收集的近交系数(http://support.illumina.com/array/array_kits/maizesnp50_dna_analysis_kit.html.).当玉米幼苗长到一个月大时,按照改良的CTAB程序对5株玉米的叶片进行批量取样,提取基因组DNA [48].评估DNA的质量,并根据Infinium®HD测定超协议指南,在北京指南针生物技术公司在北京指南针生物技术公司进行基因分型。此外,其他进入的SNP基因分型数据集是从公共数据集中提取的,包括Van Heerwaarden等人提交的400名换乘者。[23.,由Westengen等人提交的48份非洲入刊[17., 368份由Li等人提交的CIMMYT资料[21., Flint-Garcia等人提交的280份材料[45],以及Wu等人提交的367个精英系[19.].最后,根据相同的物理位置和标记名称整合来自不同面板的所有基因型。基于对明智的基础互补的转化等位基因形式。然后,根据以下SNP筛选标准成功获得了43,252个SNP:(1)次次等位基因频率(MAF)超过0.05,(2)缺失率小于0.2,(3)标记在物理地图上是明确的。

SNP和PCA的确认偏倚

为了评估的SNP的确认偏倚用于评估群体结构的细分,SNP的不同样本集跨越43252个SNPs进行取样,用窗口大小改变从50 kb至0.2 MB,其中500,700,800,1000,2000,5000,选择了10,000和15,000个SNP,具有高度遗传多样化,低缺失的速率,并且在基因组上均匀地分布在基因组上进行人口结构分析,根据PATTERSON等人描述的方法,用PCA推导出该面板的群体结构细分。[49]使用TASSEL软件5.0 [50].使用SAS软件(Release 9.3;SAS Institute, Cary, NC)。另外,根据群体结构的细分,利用前5个pc的平均相关系数来推断一个给定子集的偏倚程度。

基于模型的人口结构分析

通过比较不同SNP标记样本集对群体细分的影响。我们选择了5000个高度遗传多样性、缺失率低且均匀分布于整个基因组的SNPs,使用基于模型的方法估算1857份种质的种群结构[41结构V2.3.3中的[34].k值(亚群数)范围为1到10,为每k完成5个运行;烧伤期为5000,完成了5000份。ADHOC统计ΔK(ΔK)用于确定最佳群数[51].使用CLUMPP软件集成结构的输出[52].子种群分配是基于每次加入的最大成员概率[22.].

Neighbor-joining树结构

为了深入了解1857份来源不同的品种间的遗传关系,我们根据改良的欧氏距离(Euclidean distance),使用43252个单核苷酸多态性(SNPs)计算了不同品种间的遗传距离[53],其定义如下:D = 1 - 状态(IBS)相似性的标识,并且IBS是从相同基因座的两个个体随机导出的等位基因是相同的。对于任意两种过程,IBS的概率是对所有非缺少基因座的概率。然后使用基于邻居连接(NJ)算法的距离矩阵构造族图[54].从所得的系统发育树中鉴定簇。所有上述计算都使用Tassel Software 5.0进行[50].

基本遗传统计

在1,857份种质间亲缘关系对被定义估计如下:Fij=(问ij——问m/ (1 - Qm),问ij是ibs从i和j的随机基因座的概率,和qm是随机个体的基因座发生肠易激综合征的平均概率。配对亲缘系数分别为0、0 ~ 0.1和0.1 ~ 0.5,表明各种质间相似性较弱、中等和强[35].在PowerMarker V3.25中计算GD、杂合度和PIC [55],杂合子被定义为在单个附加过程中检测到的杂合子基因座的比例,并且GD定义为从测试样品中随机选择的两个等位基因不同的概率是不同的[18.].PIC估计如下:\ ({\ mathrm{图片}}_l = 1 - {\ displaystyle{\总和}_ {u = 1} ^ k{\波浪号{\ mathrm {p}}} _ {\ mathrm{陆}}^ 2}- {\ displaystyle{\总和}_ {u = 1} ^ {k - 1} {\ displaystyle{\总和}_ {v = u + 1} ^ k{2 \波浪号{\ mathrm {p}}} _ {\ mathrm{陆}}^ 2}}{\波浪号{\ mathrm {p}}} _ {\ mathrm {lv}} ^ 2 \)哪里p.和P.Lv.频率是多少他和V.标记等位基因L.,分别。采用皮尔逊相关系数(r2),根据先前的一项研究[56].该评估在Tassel Software 5.0中完成[50].D.美东时间值的计算遵循Yang [57]使用r'hierfstat'包(http://cran.r-project.org/web/packages/hierfstat.).D.美东时间被定义为D美东时间 = [(H测试-H最终)/(1-H最终)] / [n (n - 1)),在H最终是观察到的基因多样性在亚贫困中,h测试为总体基因多样性,n为亚种群数量[27].基因组区域的大小定义为该面板LD水平的2倍窗口大小,以及平均D美东时间定义LD中所有SNPs的临界值来解释亚群体间的相关分化水平。平均D的基因组区域美东时间超过截止值被视为亚步骤之间强烈分化的病例。

基因组宽协会研究

FT相关性状的结合,包括在三种环境中每次加入的DTT,DTP和DTS,并选择43,252个SNP以进行表型 - 基因型GWA,其在Gapit R包中实施[58]使用混合线性模型(MLM),其中人口结构和对血管关系被视为协变量[38].显著截断值定义为0.05除以标记数。选择qtn进行进一步分析P.-值小于临界值。

可获得的支持数据

支持本文结果的所有数据集都包含在文章中。

缩写

SNP:

单核苷酸多态性

HZS:

Huangzaosi

TS:

热带和亚热带

英国《金融时报》- - - - - -:

花期相关性状

GWAS:

基因组协会研究

QTL:

数量性状位点

SS:

爱荷华州硬茎合成

NSS:

Non-Stiff茎

踊跃参与:

Iodent

GBS:

基因分型结果进行排序

PC:

主成分

ΔK:

三角洲K.

MICN:

中国修改后的介绍

LD:

连锁不平衡

GDs:

基因多样性

图片:

多态信息含量

德勤:

天抽雄期

DTS:

纯洁的日子

和DTP:

花粉脱落

传销:

混合线性模型

肠易激综合症:

身份由国家

结影:

最佳线性无偏预测器

全球语言监测机构:

一般线模型

参考文献

  1. 1。

    王TY,马XL,李源,白DP,刘成,刘ZZ等。在单交玉米杂交种的产量及产量构成的变化在中国发布1964年和2001年作物科学之间。2011; 51(2):512-25。

    文章谷歌学术搜索

  2. 2。

    Matsuoka Y,Vigouroux Y,Goodman MM,Sanchez GJ,贝勒E,Doebley J.多层微卫星基因分型显示的玉米单一驯化。Proc Natl Acad SCI U S A. 2002; 99(9):6080-4。

    公共医学中心CAS文章PubMed谷歌学术搜索

  3. 3.

    王志强,王志强,王志强,等。走出美洲:追踪全球玉米扩散的基因足迹。acta photonica sinica . 2013;126(11): 2671-82。

    CAS文章PubMed谷歌学术搜索

  4. 4.

    杨ž,张E,李江,江Y,王Y,胡Y,等人。序列多态性和绿叶基因的单倍型多样性的分析了中国玉米骨干自交系透露驯化后的选择。分子生物学代表2014; 41(2):1117至1125年。

    文章PubMed谷歌学术搜索

  5. 5.

    杜breuil P ., Warburton M ., Chastanet M ., Hoisington D ., Charcosset A.更多温带玉米引种欧洲:大规模SSR基因分型和新的历史因素。51 Maydica。2006;(2):281 - 91。

    谷歌学术搜索

  6. 6.

    张志刚。1980 - 2004年美国杂交玉米家系背景的变化。作物科学。2007年,47(5):1914 - 26所示。

    文章谷歌学术搜索

  7. 7.

    Bracco M, Lia VV, Hernandez JC, Poggio L, Gottlieb AM。南美南部低地和高地农业生态系统玉米地方品种的遗传多样性:对本地资源保护的启示。北京大学学报(自然科学版)。2012;160(3):308-21。

    文章谷歌学术搜索

  8. 8.

    《植物育种的进化》。作物育种与应用,2011;11(3):197-206。

    文章谷歌学术搜索

  9. 9.

    焦勇,赵洪,任磊,宋伟,曾波,郭建军,等。玉米现代育种过程中的全基因组遗传变化。Nat麝猫。2012;44(7):812 - 5。

    CAS文章PubMed谷歌学术搜索

  10. 10。

    米克尔马,达德利JW。北美凹痕玉米从公共种质到专利种质的进化。作物科学。2006;46(3):1193 - 205。

    文章谷歌学术搜索

  11. 11.

    Schnable JC。玉米的基因组进化:从基因组回到基因。植物学报2015;66:329-43。

    CAS文章PubMed谷歌学术搜索

  12. 12.

    罗木MC,Millard MJ,Glaubitz JC,Peiffer Ja,Swarts KL,Casstevens TM等。美国国家玉米近交籽银行综合基因分型。基因组Biol。2013; 14(6):R55。

    公共医学中心文章PubMed谷歌学术搜索

  13. 13.

    特洛伊阿里,亨德里克森lg。“明尼苏达州13”玉米的背景和重要性。作物科学。2007; 47(3):905-14。

    文章谷歌学术搜索

  14. 14.

    彭斌,李永强,王永强,刘超,刘志强,谭伟,等。玉米产量构成因素及籽粒相关性状的QTL分析应用电子学报。2011;122(7):1305-20。

    文章PubMed谷歌学术搜索

  15. 15.

    玉米穗和穗部花序结构的遗传和QTL分析。应用电子学报。2006;112(4):592-606。

    CAS文章PubMed谷歌学术搜索

  16. 16.

    Vidal-Martinez VA, Clegg MD, Johnson BE。玉米花粉和籽粒产量及其构成因素的遗传研究。Maydica。2001;46(1):35 - 40。

    谷歌学术搜索

  17. 17.

    韦斯特根OT,伯格PR,肯特议员,布莱斯汀AK。非洲玉米的空间结构和气候适应的SNP多样性调查与全球育种和地方品种面板。公共科学图书馆。2012;7(10),e47832。

    公共医学中心CAS文章PubMed谷歌学术搜索

  18. 18.

    卢友,燕捷j,吉马拉斯CT,Taba S,Hao ZF,Gao Sb等。基于基因组型单核苷酸多态性的全球玉米育种种质的分子表征。Al Appl Genet。2009; 120(1):93-115。

    CAS文章PubMed谷歌学术搜索

  19. 19.

    吴旭,李艳,石艳,宋艳,王涛,黄艳,等。利用高通量SNP基因分型研究玉米优质种质的优良遗传特性。中国科学(d辑:地球科学)2014;

    文章PubMed谷歌学术搜索

  20. 20。

    Yan J,Shah T,Warburton ML,Buckler ES,McMullen MD,Crouch J.使用SNP标记的全球玉米收集的遗传表征和联系。Plos一个。2009; 4(12),E8451。

    公共医学中心文章PubMed谷歌学术搜索

  21. 21。

    李华,彭震,杨新宇,王伟,付军,王军,等。全基因组关联研究剖析了玉米籽粒油脂生物合成的遗传结构。Nat麝猫。2013;45(1):43-50。

    CAS文章PubMed谷歌学术搜索

  22. 22。

    Schaefer Cm,Bernardo R.人口结构和单核苷酸多态性多态性多态性历史明尼苏达玉米自交系。作物科学。2013; 53(4):1529。

    CAS文章谷歌学术搜索

  23. 23。

    张晓东,张晓东,张晓东,等。玉米基因组学研究进展。中国科学院院刊。2012;109(31):12420-5。

    公共医学中心文章PubMed谷歌学术搜索

  24. 24。

    王志强,王志强,王志强,等。植物遗传资源:它们能对提高作物产量做出什么贡献?中国科学(d辑:地球科学)1999;96(11):5937-43。

    公共医学中心CAS文章PubMed谷歌学术搜索

  25. 25.

    基因组计划和基因库:植物育种的新种质?中国科学院院刊1998;95(5):2001-4。

    公共医学中心CAS文章PubMed谷歌学术搜索

  26. 26.

    韦勒斯克,Sakai AK。利用系统发育方法分析植物育种系统演化。Annu Rev Ecol Syst。1999; 30:167-99。

    文章谷歌学术搜索

  27. 27.

    Jost Lou。尊重其亲属不测量分化。Mol Ecol。2008; 17(18):4015-26。

    文章PubMed谷歌学术搜索

  28. 28.

    Haag T, Santos AS, Sana DA, Morato RG, Cullen L, Crawshaw PG等。栖息地碎片化对顶级捕食者遗传结构的影响:大西洋森林美洲虎(Panthera onca)残余种群的多样性丧失和高度分化。摩尔生态。2010;19(22):4906 - 21所示。

    CAS文章PubMed谷歌学术搜索

  29. 29.

    刘红梅,王雪梅,温伟,邓敏,等。基因组、转录组和表型变异揭示了现代玉米育种的复杂适应性。摩尔。2015;8(6):871 - 84。

    CAS文章PubMed谷歌学术搜索

  30. 30.

    Hufford MB, Xu X, van Heerwaarden J, Pyhajarvi T, Chia JM, Cartwright RA, et al.;玉米驯化改良的比较群体基因组学。Nat麝猫。2012;44 (7):808 - u118。

    CAS文章PubMed谷歌学术搜索

  31. 31。

    王志强,王志强,王志强,等。玉米对温带气候的适应:中密度全基因组关联遗传和多样性模式揭示了关键基因组区域,其中Vgt2 (ZCN8)轨迹。公共科学图书馆。2013;8(8),e71377。

    公共医学中心CAS文章PubMed谷歌学术搜索

  32. 32。

    杜rocq S, Madur D, Veyrieras JB, Camus-Kulandaivelu L, Kloiber-Maitz M, Presterl T, et al.;关键的影响Vgt1玉米开花期适应:来自关联图和生态地理信息的证据。遗传学。2008;178(4):2433 - 7。

    公共医学中心文章PubMed谷歌学术搜索

  33. 33。

    Morin Pa,Martien KK,泰勒BL。评估人口结构和保护研究的SNP统计力量。Mol Ecol Resour。2009; 9(1):66-73。

    CAS文章PubMed谷歌学术搜索

  34. 34。

    Pritchard JK,斯蒂芬斯M,Donnelly P.使用多点基因型数据的群体结构推理。遗传学。2000; 155(2):945-59。

    公共医学中心CASPubMed谷歌学术搜索

  35. 35。

    杨Xh,xu yb,shah t,li hh,han z,li Js等。SSRS和SNP在玉米遗传相关性评估中的比较。genetica。2011; 139(8):1045-54。

    CAS文章PubMed谷歌学术搜索

  36. 36。

    Hamblin MT, Warburton ML, Buckler ES。简单重复序列和单核苷酸多态性在玉米多样性和亲缘关系评估中的经验比较。公共科学图书馆。2007;2(12),e1367。

    公共医学中心文章PubMed谷歌学术搜索

  37. 37.

    于建明,张志伟,朱长生,达巴楠,Pressoir G,图斯特拉MR,等。关联映射中关系估计背景标记数充分性的模拟评估。植物基因组。2009; 2(1): 63 - 77。

    CAS文章谷歌学术搜索

  38. 38.

    于JM,Pressoir的G,布里格斯WH,铋IV,山崎男,Doebley JF,等人。一种统一混合模型方法,用于占多级相关性的映射。NAT Genet。2006; 38(2):203-8。

    CAS文章PubMed谷歌学术搜索

  39. 39.

    Technow F,Schrag Ta,Schipprack W,Melchinger AE。玉米育种计划中现代种质的关键祖先鉴定。Al Appl Genet。2014; 127(12):2545-53。

    CAS文章PubMed谷歌学术搜索

  40. 40.

    杨XH,高SB,徐ST,张珍祥,人员Prasanna BM,李L等。全球种质资源收集的特性及其对玉米的复杂数量性状的分析潜在利用。mol繁殖。2011; 28(4):511-26。

    文章谷歌学术搜索

  41. 41。

    王锐,于宇,赵军,石勇,宋颖,王涛,等。中国玉米自交系迷你核心套的群体结构与连锁不平衡。应用计算机学报。2008;117(7):1141-53。

    CAS文章PubMed谷歌学术搜索

  42. 42。

    陈志强,陈志强。美国玉米种质资源的系统发育关系。Nat麝猫。2013;45(8):844 - 5。

    CAS文章PubMed谷歌学术搜索

  43. 43。

    Loaisiga Ch,Rocha O,Brantestam Ak,Salomon B,Merker A.六种遗传多样性和基因流动的中美洲的六种牧群。遗传资源庄稼EV。2012; 59(1):95-111。

    文章谷歌学术搜索

  44. 44。

    Wen W,Franco J,Chavez-Tovar VH,YAN J,Taba S.一种热带玉米种族种族杂志的核心鉴定,玉米改善进一步用途。Plos一个。2012; 7(3),E32626。

    公共医学中心CAS文章PubMed谷歌学术搜索

  45. 45。

    Yu JM, Pressoir G, Romero SM, Mitchell SE, et al.;玉米关联群体:数量性状位点分析的高分辨率平台。植物j . 2005; 44(6): 1054 - 64。

    CAS文章PubMed谷歌学术搜索

  46. 46。

    李伊,施ys,cao ys,王ty。建立玉米种质核心系列,使用地理分布和特征数据在中国国家基因库中保留。遗传资源庄稼EV。2004; 51(8):845-52。

    文章谷歌学术搜索

  47. 47。

    杨志强,杨志强,杨志强,等。玉米雄性和雌性花序性状的不同遗传结构。公共科学图书馆遗传学。e1002383 2011; 7(11)。

    公共医学中心CAS文章PubMed谷歌学术搜索

  48. 48。

    Saghai-Maroof MA, Soliman KM, Jorgensen RA, Allard RW。大麦核糖体DNA间隔长度多态性:孟德尔遗传、染色体定位和种群动态。中国科学(d辑:地球科学)1984;81(24):8014-8。

    公共医学中心CAS文章PubMed谷歌学术搜索

  49. 49.

    王志强,王志强。种群结构与特征分析。公共科学图书馆遗传学。2006; 2(12): 2074 - 93。

    CAS文章谷歌学术搜索

  50. 50.

    Bradbury PJ,张Z,Kroon de,Casstevens TM,Ramdoss Y,Buckler Es。TASSEL:多样化样本中复杂性状的关联映射软件。生物信息学。2007; 23(19):2633-5。

    CAS文章PubMed谷歌学术搜索

  51. 51.

    利用结构化软件检测个体聚类数量:一项仿真研究。摩尔生态。2005;14(8):2611 - 20。

    CAS文章PubMed谷歌学术搜索

  52. 52.

    雅各布森,罗森堡,美国。群集匹配和排列程序,用于处理种群结构分析中的标签转换和多模态。生物信息学。2007;23(14):1801 - 6。

    CAS文章PubMed谷歌学术搜索

  53. 53。

    Legesse BW,Myburg AA,Pixley KV,Hotsa Am。SSR标记揭示非洲玉米自交系的遗传多样性。秘密人。2007; 144(1):10-7。

    CAS文章PubMed谷歌学术搜索

  54. 54。

    张W,Sun Zr。随机局部邻居加入:一种重建系统发育树的新方法。mol phylocyet evol。2008; 47(1):117-28。

    CAS文章PubMed谷歌学术搜索

  55. 55。

    Liu KJ, Muse SV。PowerMarker:遗传标记分析的集成分析环境。生物信息学。2005;21(9):2128 - 9。

    CAS文章PubMed谷歌学术搜索

  56. 56。

    山WG,Weir BS。基因定位的最大似然估计。我是j嗡嗡声的遗传。1994年; 54(4):705-14。

    公共医学中心CASPubMed谷歌学术搜索

  57. 57。

    杨RC。评估分级统计量。进化。1998;52(4):950 - 6。

    文章谷歌学术搜索

  58. 58。

    田芳,王群生,李敏,李敏,等。基因组关联和预测集成工具。生物信息学。2012;28(18):2397 - 9。

    CAS文章PubMed谷歌学术搜索

下载参考

致谢

在本文中使用的某些基因分型数据集是由面包车Heerwaarden等报道。[23., Westengen等[17., Li等人[21.]和Flint-Garcia等人。[45].我们感谢他们和他们的同事分享他们的基因分型数据。国家自然科学基金资助项目(no . 91335206);中国博士后科学基金资助项目(no . 2014M550901);中国农业科学院创新工程资助项目(no . 2014CB138200, no . 2011DFA30450)。

作者信息

隶属关系

相应的作者

对应于俞莉要么天宇王

额外的信息

利益争夺

两位作者宣称他们没有相互竞争的利益。

作者的贡献

XW,XL和CL进行了不同自交系的表型和基因分型。XW实现了所有数据收集,分析并编写了此稿件。XW,YL,TW,YS,YS,ZZ和YL构思了这项研究,并参与了其设计和协调,并帮助起草了稿件。所有作者均已读取并批准最终手稿。

附加文件

附加文件1:

图S1。不同标记大小的特定子集与所有标记的整个集合的前五个主成分(PC)的相关性分析。图S2。成对比较的维美东时间在不同的染色体上。图S3。花期相关性状汇总统计。直方图显示了花期相关性状的分布。上直角三角形中的数字是与开花时间相关的性状之间的皮尔逊系数,以及同一性状的环境之间的皮尔逊系数。左下角的三角形是开花时间相关性状之间和同一性状环境之间的散点图。图S4。比较两个数据集(分别包含43,252和85个SNPs)的遗传变异。每一次分散代表一次加入。黑线是所有散射点的拟合。(邮政编码850 kb)

附加文件2:

表S1。来源摘要信息,并在1857年国家加入共同祖先成员表S2。GWAS是花期相关性状及相关连锁QTL或基因的结果。表S3。带有D的基因组区域美东时间和相关连锁QTL。(XLSX 299 kb)

权利和权限

开放访问本文遵循知识共享署名4.0国际许可协议(http://creativecommons.org/licenses/by/4.0/)如果您向原始作者和源给出适当的信用,则允许在任何介质中进行不受限制的使用,分发和再现,提供指向Creative Commons许可证的链接,并指示是否进行了更改。Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)除非另有说明,否则适用于本文中提供的数据。

再版和权限

关于这篇文章

通过CrossMark验证货币和真实性

引用这篇文章

吴,十,李,Y.,李X.et al。遗传分化与基因组变异的分析,揭示玉米改善期间重要性区域。BMC植物杂志15,256(2015)。https://doi.org/10.1186/s12870-015-0646-7

下载引用

关键字

  • 基因组变异
  • 分组人口分化
  • Zea Mays.L.