跳到主要内容

亚麻核心种质的遗传特征分析(亚麻属植物usitatissimumL.)适合于关联制图研究和纤维和亚麻籽类型间不同选择的证据

摘要

背景

亚麻因其纤维、籽油和营养保健品而受到重视。最近,纤维行业投资开发由亚麻籽茎制成的产品,使其成为一种双重用途作物。同时定位控制茎纤维和种子品质性状的基因组区域,可以实现双重用途品种的培育。然而,由于基因组资源最近才开发出来,尚未对亚麻的遗传多样性、群体结构和连锁不平衡(LD)模式进行评估。利用448个微卫星标记对全球分布的407份亚麻材料进行了特征分析。对数据进行分析,以评估该核心集合对AM的适用性。利用亚麻全基因组霰弹枪序列对亚麻和亚麻籽在分化育种过程中选择的候选基因进行了基因组扫描。

结果

组合遗传结构分析将所有材料划分为2大类群和6个亚类群。主要类群间的种群分化较弱(F= 0.094),大多数亚组间两两比较。分子共祖先分析表明,大多数个体对的亲缘关系较弱(平均= 0.287)。总体群体遗传多样性丰富(5.32个等位基因/位点),个别亚群存在较高的私有等位基因比例。全基因组平均LD (r2)为0.036,衰减速度相对较快,为1.5 cM。对亚麻纤维和亚麻籽进行基因组扫描,发现了与细胞壁生物发生/修饰、木质部鉴定和脂肪酸生物合成有关的候选基因,这些基因与亚麻和其他植物中已发现的基因一致。

结论

基于丰富的遗传多样性、较弱的群体结构和亲缘性以及相对较快的LD衰减,本研究认为该核心种质适合进行针对亚麻多种农艺和品质性状的AM研究,旨在将亚麻作为真正的双重用途作物进行改良。我们的基因组扫描提供了对亚麻中受分歧选择影响的候选区域的第一次见解。结合AM,基因组扫描能够提高检测影响复杂性状的位点的能力。

背景

亚麻(亚麻属植物usitatissimumL.)是一种一年生自花授粉物种,基因组大小约为370mb [1]。该物种被认为起源于中东或印度地区。2]并在传入新大陆之前传遍了亚洲和欧洲[3.]。几千年来的不同选择导致了纤维和亚麻籽的种类相同,但在形态、解剖、生理和农艺性能上存在很大差异。4]。纤维亚麻品种较高,分枝较少,生长在中国、俄罗斯联邦和西欧的寒温带地区[3.]。亚麻籽品种较矮,分枝较多,种子较大,在加拿大、印度、中国、美国和阿根廷的大陆性气候区种植面积较大[3.]。亚麻是食品、医药和纺织品的原料,因此,8000多年来,它对人类文化和发展至关重要[5]。亚麻籽油因其高含量的omega-3 α亚麻酸(55-57%)而闻名于世。几个世纪以来,亚麻籽油一直被用于油漆和清漆,因为它独特的脂肪酸成分具有独特的干燥性能。6]。食用磨碎的亚麻籽增加了营养价值,因为亚麻籽也是木脂素的丰富来源,木脂素是具有抗癌特性的化合物[7]。在过去十年中,纤维工业一直致力于从亚麻籽茎中开发高价值产品,并将其应用于纸浆、技术纤维和生物燃料工业[48]。因此,了解亚麻种质的遗传多样性对于持续改良亚麻种质以及将其发展成为真正的双重用途作物具有重要意义。8]。

利用形态学参数对亚麻进行了初步的多样性评估[9- - - - - -12]和同工酶[1314]。近年来,随机扩增多态性DNA (RAPD)、扩增片段长度多态性(AFLP)、简单序列重复间(ISSR)、简单序列重复间(SSR)和反转录转座子扩增多态性(IRAP)等分子标记系统被用于测定亚麻栽培品种和地方品种的遗传变异和亲缘关系[j]。15- - - - - -29]。然而,这些先前的研究大多评估了少数标记位点或少数基因型。

世界基因库储存了大约48,000份亚麻种质[30.]。在加拿大,由加拿大植物基因资源(PGRC)维护着大约3500种栽培亚麻的世界收藏。这个集合传统上通过各种常规策略部署在亚麻育种中[3.]。2009年,全面利用亚麻基因组学(TUFGEN;http://www.tufgen.ca)项目在加拿大启动,旨在产生亚麻基因组资源,并将其应用于一系列性状,以实现亚麻改良的最终目的。TUFGEN项目开发了许多基因组学资源,包括分子标记[232931]、基因图谱[3233],物理图谱和细菌人工染色体末端序列[1],表示的序列标签[34]和全基因组鸟枪序列[35]。为了利用这些工具,收集了407个亚麻材料的核心集合,这些材料捕获了PGRC收集的表型多样性的广度。

数量性状位点(QTL)和关联图谱(AM)是鉴定标记-性状关联的互补方法。第一种方法利用双亲本定位群体来监测QTL和标记位点的共分离。第二种方法利用种质收集来鉴定基于LD的qtl标记相关性[36]。由于单个杂交中减数分裂事件的积累,QTL分析的定位分辨率有限,但不受群体结构的影响,而群体结构可能是AM中虚假关联的来源。相反,AM可以通过种质资源中大量的历史重组事件获得更高的制图分辨率。理想的关联组应该包含最广泛的遗传多样性,因为这通常与快速的LD衰减有关,这对于解决单个基因或核苷酸的复杂性状变异是必要的[37]。群体结构为零或弱,种质间的亲缘关系较低也是可取的。因此,在进行AM分析之前,需要对遗传多样性、群体结构、家族亲缘性和LD模式进行评估,以充分利用它们在亚麻遗传改良中的优势。

本研究利用448个微卫星位点对407份亚麻材料进行基因分型。总体目标是评估这种亚麻核心收集对AM研究的有用性。我们的具体目标是:(1)调查遗传多样性;(2)估算种群结构水平,评估家族亲缘关系;(3)检测LD的模式;(4)鉴定纤维和亚麻籽类型之间潜在的非中性基因组区域。

结果

系统发育分析

基于414个中性位点,采用NJ算法进行系统发育分析,将407个条目划分为两个主要类群和一个混合类群(图2)1一个;额外的文件1:表1)。第一组(G1)由155个成员国组成,再细分为三个亚组,分别代表南亚、西欧和南美洲的成员国。南亚分集团主要包括印度、巴基斯坦和阿富汗,西欧分集团主要包括法国、葡萄牙和德国,但也包括罗马尼亚和土耳其。南美亚组包括阿根廷和乌拉圭的加入。第三组(G3)有206个成员,分为北美和东欧两个亚组。北美亚群聚集了只来自加拿大和美国的品种和育种材料。然而,并非所有的北美材料都聚集在该亚群中。这些国家中有少数被列入东欧分集团,其他主要国家包括俄罗斯、乌克兰、罗马尼亚、波兰和立陶宛。这一亚组包括核心馆藏中90%的纤维亚麻品种。在东欧亚组中,地理来源和工业用途重叠,包括荷兰,前苏联和美国的纤维亚麻加入。混合组(G2),即北美/欧洲组,有来自美国,加拿大和欧洲国家的43个加入。

图1
图1

核心种质407份亚麻材料的亲缘关系及群体结构。(一)使用邻居连接(NJ)算法创建的系统发育树[62]和来自414个中立ssr的信息。彩色的簇表示主要组中的子组。比例尺表示Nei [62最小遗传距离。(b)贝叶斯聚类(结构K= 2)。组内子组根据NJ分析得到的聚类进行分布。隶属系数Q < 0.7的材料为第2组。(c)平均对数似然值(10次迭代的平均lnP(D)±SD)和特设统计ΔK70]K取值范围为1 ~ 12。

人口结构

共有259个基因座符合中性标准,LD < 0.4,分布在15个连锁组中,被纳入这些分析。与基于NJ算法的系统发育分析类似,PCoA显示存在两个主要类群,尽管在子类群之间存在一些混合(附加文件2:图S1a)。坐标1和坐标2解释了总遗传变异的65.8%。STRUCTURE中实现的基于贝叶斯的聚类方法也根据Δ确定了两个组k方法(图1b, c)。根据估计的隶属系数()、南亚、西欧及南美的分组(> 0.70)可以聚集在G1内,北美和东欧亚组(> 0.70)可以在G3内类似地聚集。北美/欧洲亚群(G2)主要是其他两个主要群体的混合体。总的来说,NJ、PCoA和STRUCTURE分析一致同意407个亚麻品种的分布分为两个主要群体。此外,NJ和STRUCTURE分析一致同意将藏品划分为六个子组,子组之间几乎没有差异。种群分化系数(F)测定的弱群体结构证实了PCoA和STRUCTURE分析显示的高共享等位基因比例= 0.094, P < 0.001)。在北美,亚组之间的分化水平为0.02 (P < 0.001)vs东欧)为0.16 (P < 0.001)vs南亚)(附加文件2:图S1b)。

分子coancestry

基于448个微卫星的等位基因分析,两份亚麻种质间的分子共亲缘平均为0.287。大约70%的配对一致性估计值在0.1到0.3之间(图2)2a).亚群内分子共祖范围为0.587(西欧)~ 0.713(东欧)。对分子共祖先的估计范围为0.525(北美)vs西欧)到0.633(北美)vs东欧)(图2c).总体而言,核心集合和亚群中超过80%的成对分子共亲缘估计分别在0.114 ~ 0.350和0.525 ~ 0.601之间。共祖先分析表明,大部分亚麻种质与核心种质和亚群的亲缘关系较弱,这可能反映了PGRC种质具有广泛的遗传多样性,以及在构建核心种质时对种质进行了精心选择。

图2
图2

双分子共祖估计分布和连锁不平衡衰减。(一)407个亚麻种质的全球分子共亲缘估计。只有亲缘关系值在0到0.5之间。(b)LD衰减散点图(r2)对比15个连锁组间连锁SSRs对的遗传距离(cM)。内面板显示了位于5厘米内的标记的LD衰减的详细视图。衰变曲线是根据Breseghello和Sorells [75]。蓝线表示显著性阈值水平(r2= 0.1)。红线表示连锁标记的平均全基因组LD。(c)双分子共祖先估计[72在六个子组中的每一个。对角线值对应于亚群内的分子共祖先。(d)6个亚群中每一个连锁标记的平均全基因组LD衰减曲线。

遗传多样性

在核心收集中,保留的414颗中性微卫星共检测到2202个等位基因(N一个)(平均= 5.32个/位点),其中1187个(54%)的MAF < 0.05,属于罕见等位基因(R一个).总无偏基因多样性(UHe)和观察到的杂合度(Ho)分别为0.427和0.023。等位基因丰富度(R年代)估计为5.68,近交系数(F)为0.946,PIC值为0.374。对主要类群和亚类群的遗传多样性参数也进行了估计(表2)1).参数N一个, R年代,∏,r一个尽管G1的种群规模比G3小25%,但G1的PIC优于G3。参数Ho和F在整个核心集合中,主要类群和亚类群与该物种主要的自花授粉性质一致。

表1两大类群核心集合体的遗传多样性参数G1和G3),混合组G2他们的潜艇-
表2联动不平衡的核心集合为两大类群G1和G3),混合组G2他们的6个潜艇-

连锁不平衡

为了分析LD变异,从亚麻的共识连锁图谱中获得293个微卫星的遗传距离[33]。相邻标记间的平均全基因组距离为5.3±2.4 cM。在核心集合中,平均值r2连锁和非连锁标记的值分别为0.036和0.023。95年th百分位的r2未连锁标记的分布为0.09,10.81%的位点对存在显著LD。在1.5 cM内,全基因组平均LD衰减至0.1(图2)2b).子组和主要组内LD值见表2.平均r2G1的连锁和非连锁标记值高于G3,显著LD的位点百分比较低,G1为8.10%,G3为12.22%。亚组内观察到LD衰减较慢(图2)2d)在1.5 cM(北美-欧洲)到6.0 cM(南美)之间,这可能是由于与核心集合相比,某些亚群的群体规模有限和遗传多样性狭窄。无论数据集,即核心集合或推断组,平均值r2与非连锁标记相比,连锁标记的遗传多样性仍然更高,这表明物理连锁是该核心集合中遗传多样性的主要决定因素。核心收集中相对快速的LD衰减表明,有效的AM需要高标记物饱和度。在一些子群中较慢的LD衰减可以用于探索性AM或粗映射。

非中性位点的鉴定

对核心收集的92份纤维材料和随机抽取的92份亚麻籽材料中的纤维和亚麻籽组进行瓶颈分析[38]。模移测试显示两组中等位基因频率呈典型的l型分布(数据未显示),当稀有等位基因数量众多时,预期会达到突变漂移平衡,因此表明没有最近的瓶颈[39]。标志检验表明纤维组杂合度过剩(瓶颈)(P < 0.01),而亚麻籽组不存在(P = 0.346)。种群结构分析显示,Δ出现了一个尖峰kK= 2主要对应于纤维和亚麻籽类型(附加文件3.:图S2a, b)。因此,没有检测到等级群体结构,并采用两个原始群体(纤维和亚麻籽)进行后验分析。中性预期的扭曲分别在EW、ln RH、LOSITAN和Arlequin位点的41、13、14和26个位点被检测到(数据未显示)。共有9个基因座(平均F= 0.16)分布在7个连锁组中,在四项检验中至少有两项具有显著性,并且被认为是真正的异常值(表2)3.).纤维组和亚麻籽组的ld0 ~ 1.0与相邻位点的ld0 ~ 0.10之间。

表3纤维与亚麻籽类型间差异选择的离群值分析

c306-s98_Lu765Bb与其最近位点c306-s98_Lu3063之间的物理遗传距离为364 kb/cM。考虑到它们之间的LD为1,遗传距离估计为1.3 cM,我们研究了474 kb的物理间隔。在这段时间内共预测了98个基因,其中59个与UniProtKB蛋白数据库的高质量注释具有显著的相似性4表2)。c16-s156_Lu373和c16-s156_Lu139的物理遗传距离为178 kb/cM, LD为中等(r2= 0.22)。因此,搭便车效应可能不会延伸到1.9 cM的总遗传距离上。我们估计了两个亚麻类群的LD衰减,以计算LD强的平均遗传距离(附加文件)3.:图S2c)。LD在约0.2 cM内衰减到0.4,相当于36 kb,其中只有5个高度相似的基因被预测。不同弱LD支架的预测基因数(r2< 0.2)与注释蛋白具有显著相似性,范围从3 (c175-s86_Lu2824, c206-s208_Lu128和c441-s225_Lu3189)到5 (c36-s291_Lu176和c108-s305_Lu595)(附加文件)4表2)。

根据EST和蛋白质证据,GO注释可以分配到约60%的预测基因,这些基因在亚麻中表达。将86个候选基因的预测蛋白映射到UniProtKB数据库中,由于单个蛋白与多种功能、过程或成分的多重关联,产生了1,035个GO注释[40[附加文件4表2)。氧化石墨烯分子功能的前四类是“结合”(21.9%)、“催化活性”(14.4%)、“核苷酸结合”(10.6%)和“水解酶活性”(10%)(附加文件)5:图S3a)。同样,与非中性位点的候选基因相关的蛋白质的功能表征表明未知的广泛的“生物过程”(19.1%),其次是“细胞过程”(16%),“代谢过程”(11.1%)和“应激反应”(7.6%)(附加文件)5:图S3b)。候选基因产物定位于膜(11.8%)和细胞内(9.2%)5:图S3c)。大约4.6%的预测蛋白定位在细胞壁上。我们在可能受分化选择影响的候选基因中鉴定出了与细胞壁生物发生/修饰、木质部鉴定、生长素调控和脂肪酸生物合成相关的关键基因(附加文件)4表2)。

讨论

为了促进亚麻生产的长期可持续性和多样化,PGRC储存的种质资源在形态、物候和农艺方面进行了全面的表征[j]。22]。这些有价值的表型信息为407份亚麻核心种质的构建提供了基础,为进一步的亚麻遗传研究和改良提供了依据。在这里,我们报告了基于448个微卫星位点的核心集合的遗传特征,这代表了迄今为止发表的最大的亚麻遗传研究之一[14- - - - - -1618- - - - - -2123- - - - - -26282941]。

遗传关系和群体结构

了解核心集合的遗传关系和结构是控制AM假阳性的关键[37]。NJ树对407种亚麻材料进行了分类,主要但不完全按照地理来源进行分类。地理分组之外的国家加入的原因可能是,在捐助国被视为原籍国的地方,护照数据有时可能较弱。因此,子群体的名称是根据其中大多数加入的地理来源来分配的。

G1的南亚亚群在遗传上最明显。傅(20.]报道了用149个RAPD标记对2727份亚麻材料进行评估的类似结果。然而,在他的研究中,印度次大陆和中亚被认为是相关的群体,而不是一个统一的集群。标记系统和基因组覆盖范围的差异(414个微卫星标记和149个RAPD标记)可以解释研究之间的分辨率差异。法国、德国、英国和匈牙利之间积极的亚麻种质交流为西欧集团提供了支持。[42]。G1种质间的遗传关系也得到了亚群间弱群体分化的支持= 0.05 - 0.11,附加文件2:图S1a, b)。在G3内,北美亚群反映了美国和加拿大之间的历史种质交换[18]。东欧亚组包括大部分来自荷兰和前苏联的纤维亚麻,但也包括未混合的亚麻籽。它们被一小群聚集在这个亚群中的美国加入所分开。美国的产品主要是纤维型。在种群结构分析中也观察到类似的结果(0.02)子组之间(附加文件2图S1a、b)可以解释美国加入的间隙性存在。我们的联合方法支持的两个主要群体显示出微弱的群体细分,支持该集合中捕获的遗传多样性的广度,使其成为AM的理想选择[36]。

分子coancestry

强大的种群结构、家族亲缘关系或两者兼而有之,可能对核心集合有显著影响,并对AM产生负面影响。Yu等。[43]开发了一种混合线性模型(MLM),其中包含了两两亲缘关系(K矩阵)来纠正相关性。虚假关联不能完全由人口结构控制(矩阵)[3743]。模型包含K与仅使用a相比,矩阵在控制误报率的同时保持统计能力方面通常优于使用a矩阵(43]。

在自花授粉作物或自交系中,同祖先的估计值往往高于异交物种,因为高杂合性降低了在一个位点上观察到的两个等位基因在各州相同的可能性[44]。在我们的核心集合中,大约80%的两两共祖估计范围在0.1到0.3之间,这表明大多数系具有较弱的亲缘关系(图1)2a).我们预计,由于核心集合的弱种群结构和相关性,传销修正为K应提供足够的统计能力,以控制未来研究中大部分假阳性的关联[43]。

遗传多样性

一个合适的AM核心集合应该包含尽可能多的表型和分子多样性,在给定的环境中可以可靠地测量[3637]。在414颗微卫星中,平均每个位点有5.32个等位基因。该数值高于先前报告的范围(2.72 - 3.46)[28414546]。这种等位基因的多样性甚至超过了lusitatissimuml .无性系种群。angustifolium(Huds)。Thell。,(wild progenitor) andlusitatissimuml .无性系种群。usitatissimum(4.62) (26]。这一高值可能与分析的基因型数量(407个)、种质的选择、微卫星位点的数量(448个中有414个是中性的)以及微卫星重复类型和长度有关。2947]。

G1组的私有等位基因数量高于G3组(表2)1).西欧亚组的私人等位基因尤其丰富,有246个。新的遗传变异,以前没有取样或利用在现代亚麻育种计划,可能存在于这个亚群,提供独特的等位基因,拓宽亚麻基因库的多样性。这与以往报道亚麻种质资源遗传多样性普遍较低的研究相反[18212326- - - - - -28]。虽然我们核心馆藏中85%的材料是栽培品种和育种材料,但该馆藏具有丰富的遗传多样性,这对于剖析QTL的遗传基础并立即应用于亚麻育种具有有利的属性[3648]。

连锁不平衡

低LD要求使用密集的标记集,从而导致标记与QTL之间的紧密联系,这是育种应用的有利标准,因为标记的预测能力将在几代之间保持稳定[36]。平均r2的平均值为0.036,全基因组平均LD在1.5 cM内衰减(图2)2b).在自花授粉的物种中,重组效果不如异种杂交的物种,LD下降得更慢[36]。尽管如此,构成该集合的种质在LD变异中起着关键作用,因为LD的程度受到目标群体捕获的遗传变异水平的影响。例如,在野生大麦(大麦芽ssp。spontaneum),尽管其自花受精率很高(~98%),但LD在2 kb内就会腐烂,这与在异交物种玉米中观察到的值相似[49]。该核心集合的低LD决定了需要更高的标记饱和度,以提供卓越的映射分辨率和AM的QTL检测能力[50]与使用双亲连锁图相比。或者,选择F值低的亚群而更高但相似水平的LD则需要减少探索性AM的个体和标记物数量。

除北美和东欧亚群最高外,各亚群中显著LD位点对的比例基本相似,这可能反映了这些亚群的人工选择强度更大,种质资源范围更窄[18]。虽然我们的核心集合没有表现为非结构化的大种群,但我们对种群结构的综合分析表明,G1和G3是弱分化的,代表了两个祖先种群,最大限度地减少了LD差异和潜在的虚假关联(图1)1a, b).因此,我们在不同遗传群体中的LD表征结果通过提供收集的基本特征证明其对AM的有用性,为在亚麻中进行具有成本效益的AM研究提供了多功能性。

非中性位点的鉴定

亚麻是少数受到破坏性选择影响的驯化植物之一[8]。北美几乎只种植亚麻籽,直到最近,亚麻籽茎被认为是弊大于利,因为它们的田间生物降解缓慢。然而,由于对从亚麻籽品种的茎中提取价值的兴趣,短纤维的使用在过去几年中在北美受到了越来越多的关注[4]。茎纤维含量似乎与亚麻种质的定性或定量植物特性无关[j]。4表明高纤维含量种子的农艺性状和种子品质性状不存在主要的生物学限制。

在作物驯化和随后的选择性育种过程中,它们受到强烈的选择压力,这些压力直接指向控制重要农艺性状的基因[47]。在正选择下,有利等位基因的频率会增加,直到固定。作为基因搭便车的影响,与有益等位基因密切相关的位点可能会出现中性预期的扭曲。基因组扫描可以鉴定出与几种作物驯化和育种性状有关的候选基因座[4751]和家畜[5253]。然而,人口结构和瓶颈可以模拟选择的效果,并产生假阳性。基于不同假设的几种方法的组合可以减少误报[54]。

我们应用了四种不同的中性测试来确定偏离中性预期的基因组区域,这些区域可能与纤维和亚麻籽的分化选择有关。总共在9个位点鉴定出86个候选基因(附加文件4表2)。在我们的候选基因中,我们发现了一个参与棉花细胞形态发生和纤维伸长的β-微管蛋白[55],一种与亚麻细胞壁生物生成/降解有关的葡聚糖内切-1,3-β-葡萄糖苷酶[56],一种参与多糖降解的几丁质酶[56],一种影响桉树中纤维素微纤维角度的MYB转录因子[57]和参与亚麻木质部鉴定的III类HD-Zip蛋白4 (HB4) [58[附加文件4表2)。候选基因如丙酮酸脱氢酶E1和脂肪酸α -羟化酶参与脂肪酸生物合成过程也被确定(附加文件)4表2)。然而,亚麻细胞壁修饰和纤维素合成的关键酶β-半乳糖苷酶和纤维素合成酶[5658在9个基因位点中都没有出现。先前在亚麻下胚轴和韧皮部纤维发育的微阵列分析中发现的基因[56]和亚麻茎内外组织间的差异表达基因[58]在候选基因中被发现(附加文件4表2)。

虽然初步的,我们的扫描提供了非中性位点的潜在影响的发散选择在亚麻的第一次见解。候选基因,特别是先前报道的[5658],将需要进一步的调查和验证。为了提高识别额外候选基因座的概率,需要高密度的标记。目前,新一代测序技术能够以合理的价格对大量的加入物进行重测序。因此,高质量和密集的单核苷酸多态性(SNP)标记有望为亚麻非中性基因组区域的鉴定提供全面的基因组覆盖[qh]53]。这种用于亚麻遗传研究的基因组工具正在开发中,更全面的基因组扫描将在不久的将来成为可能。

结论

与以往的亚麻遗传研究相比,本研究显示出较高的遗传多样性。弱的种群结构和亲缘性以及相对较快的LD衰减表明该亚麻核心种质适合AM。独特的分化育种应用于纤维亚麻和亚麻籽亚麻品种的开发提供了一个独特的机会,了解在驯化和改良过程中人类的需求是如何塑造亚麻基因组的,以及这些分化的基因组区域如何在亚麻作为双重用途作物的育种中被部署。

方法

植物材料

对PGRC亚麻进行了种子特性、抗病性和物候性状的田间评价[j]。22]。在此基础上,构建了381份亚麻核心种质,代表了PGRC亚麻世界种质的表型多样性。在此基础上,又增加了26个与近期加拿大亚麻育种计划相关的选种,使核心选种达到407个。有关地理来源和改进状况的信息显示(附加文件)6:表S3和附加文件7:图S4)。核心藏品包括92个纤维品种、285个亚麻籽品种和30个未知品种。

DNA分离和微卫星基因分型

从每一株植株的叶片组织中提取基因组DNA [23]。用荧光仪定量DNA,并稀释至6 ng/μL工作液。448颗微型卫星[2329454659]分布于15个连结组别[33]是按照先前描述的程序进行分析的[23]。简单地说,扩增产物在ABI 3130xl遗传分析仪(Applied Biosystems, Foster City, CA, USA)上进行分辨。输出文件由GeneScan (Applied Biosystems)进行分析,随后导入到Genographer中。使用GeneScan ROX-500和MapMarker®1000 (BioVentures Inc., Murfreesboro, TN)内部尺寸标准估计片段大小,生成的基因型数据矩阵用于所有后验分析。每个位点的基因型根据其等位基因在bp中的大小或作为显性标记的空等位基因进行编码。在使用Ewens-Watterson (EW)中性测试进行其他下游遗传分析之前,通过微卫星测试了选择性中性状态[60在POPGENE v.1.31中实现[61有1000种排列,没有替换。

系统发育分析

为了评估核心集合中成员之间的遗传关系,使用邻居连接(NJ)算法生成了一个树形图[62]基于Nei的[62在PowerMarker v.3.25中实现的最小遗传距离方法[63],并由MEGA 5 [64]。Nei [62最小遗传距离法适用于任何种群,而不考虑每个基因座的等位基因数量、进化力的模式和所研究生物的繁殖方法。因此,当个体表现出不同的选择强度、繁殖目标和改良状况时,这是对人工种群中遗传关系的现实估计。用小等位基因频率(minor等位基因frequency, MAF) < 0.05的414颗中性微卫星进行分析。将每个标记的基因型编码为两个等位基因,分别为纯合状态(等位基因1/等位基因1)和杂合状态(等位基因1/等位基因2)。空等位基因“Null / Null”编码为999/999,缺失值编码为“?/?”。树状图拓扑结构的可靠性通过1000次带替换的自举验证。

人口结构

通过主坐标分析(PCoA)和贝叶斯分析(bayesian based analysis)对种群结构进行了分析。由于LD可以同时影响PCoA和STRUCTURE分析,因此我们通过排除强LD中的微卫星来细化标记集,即相关系数为(r2)大于0.4 [65]。等位基因频率在PowerMarker v.3.25中计算[63], MAF < 0.05设为“U”(缺失数据),排除LD分析。从亚麻微卫星一致连锁图谱中获得了标记间的遗传距离[33]与实体地图结合在一起[1]。已连结及未连结的LD (r2)使用GGT 2.0 [66],基因型数据编码如下:100/100 = A, 200/200 = B, 300/300 = C等,其中每个字母代表一个不同的等位基因。杂合个体被认为缺失值“U”。PCoA采用GENALEX v.6.41在多维空间进行数据标准化[67]。人口结构分析采用structure 2.3.3 [6869]。混合模型使用了1万次和10万次迭代K种群数量从1到12。每人10次K值和特设统计Δk用于确定最佳子组数[70]。在群体结构分析之前,利用每个等位基因的大小对SSR数据进行编码,缺失值用“-9”表示。估计隶属度≥0.70的入组被分配到相应的组;估计隶属度< 0.70的品种被分配到混合组。我们采用的临界值为0.70,因为85%的材料是栽培品种和育种材料,因此它们的基因组结构很可能类似于一个以上的祖先群体。推断出的子组在disstruct [71]。成对F使用GENALEX v.6.41进行比较计算[67来确定推断出的遗传群体之间的遗传差异。

分子coancestry

当AM模型没有考虑到强烈的家族关系时,它可能会潜在地增加虚假关联的数量。使用分子共祖先参数(fij)根据卡巴列罗和托罗[72]。两个个体之间的分子同源性j是两个个体中来自同一基因座的两个随机抽样的等位基因在状态上相同的概率[72]。两个个体之间的分子同源j在给定的轨迹处,可以使用以下评分规则计算[72]:作用力l=¼[11+12+21+22),xy1当等位基因吗x在轨迹l在个人和等位基因y在个体的同一轨迹上j是相等的,否则为零。注意,这个估计值只能有四个值:0、1 / 4、1 / 2和1。两个个体之间的分子同源性j作用力)可以简单地取平均值l位点分析。使用MolKin v.3.0软件,使用所有448颗微卫星计算了比较核心集合内和上述确定的不同遗传群体内所有对个体的分子共祖矩阵[73]。基于等位基因大小的基因型数据编码为2个等位基因,采用Genpop软件格式为:100/200 = 0102,200/200 = 0202等。缺失的值被标记为“0000”。

遗传多样性

基于414个中性微卫星,估计了上述遗传群的遗传多样性参数。无偏基因多样性(UHe),观察到杂合性(Ho),等位基因总数(N一个)、近交系数(F)和多态位点(%)在GENALEX v.6.41 [67]。等位基因丰富度(R年代)和私人等位基因(∏)对样本大小差异进行了校正,并使用HP-RARE v.1.2中实施的稀薄方法进行了估计[74]。在PowerMarker v.3.25中计算罕见等位基因数量(MAF < 0.05)和多态性信息含量(PIC)值[63]。

连锁不平衡

通过计算估计LDr2使用GGT 2.0 [66],如上文人口结构部分所述。亚麻一致性图谱中仅有染色体信息已知的微卫星[j]33]进行LD估计。同一连接组上的微卫星被认为是连接的,不同连接组上的微卫星被认为是未连接的。通过NJ和群体结构分析确定的不同遗传群体,估计了总面板中连锁和非连锁标记的平均LD。95年th百分位的r2非连锁标记的分布被认为是截止LD值,以确定LD是否由物理连锁引起[75]。全基因组平均LD衰减与遗传距离的关系如前所述[75]。的临界值r2设= 0.1来估计全基因组的平均LD块。为了比较不同遗传群体之间的LD衰减趋势,我们将LD值平均到与估计的全基因组平均LD块相等的距离区间。

非中性位点的鉴定

为了确定与可能经历了分歧选择的基因组区域相关的候选位点,我们使用了核心收集中的92个亚麻纤维材料(附加文件)6PowerMarker v.3.25中的" line selection "模块[63允许从大量种质资源中选择一组核心品系,从而最大限度地提高遗传多样性。同样,这个模块可以从大量的种群中选择一组随机的行。使用PowerMarker v3.25 [63我们随机选取了92份亚麻种子材料(从核心收集的285份亚麻种子材料中),捕获了100组随机的92份亚麻种子材料中存在的等位基因的平均数量,用于非中性位点的鉴定。由于瓶颈可能会产生假阳性异常值,因此假设为微卫星数据提出的两相突变模型,使用瓶颈v.1.2.02对纤维和亚麻籽组进行分析[38]。基因型数据遵循上述Genepop格式。我们应用了四个异常值检验来最小化假阳性的数量。(1) Ewens-Watterson (EW)检验统计量,通过评估单个群体中与预期杂合度(Dh/sd)的显著偏差来识别正选择的位点[76使用瓶颈v.1.2.02 [38]。在未置换的1000个排列中,具有统计学意义(Dh/sd < - 2.5, P < 0.05)。(2) ln RH测试通过计算两个群体的基因多样性比率来识别与基因组其余部分变异不同的位点[77]。在标准化ln RH估计后,95%的中性位点的值预计在- 1.96和1.96之间。大于1.96 (P < 0.05)的位点为非中性位点。(3)博蒙特和尼科尔斯夫妇[78]在LOSITAN实施的方法[79]根据杂合性的分布和F在岛屿移民模式下。F的期望零分布得到每个位点的值和估计P值[79]。超过95%置信区间的位点被认为是非中性的。基因型数据也遵循上述Genepop格式。(4)分层岛模型,该模型通过允许群体内比群体间更多的移民交换来识别异常位点,同时产生F的零分布值,以减少误报的数量,也应用于数据集[80]。纤维组和亚麻籽组采用STRUCTURE 2.3.3进行分析[6869]使用特别统计Δ来确定要纳入分层分析的组数k70]。期望的F分布使用Arlequin v.3.5 [81]。95%置信区间以外的位点被认为是非中性的(P < 0.05)。每个标记的基因型根据其大小估计编码为两个等位基因,其中纯合状态为100100,杂合状态为100200。空等位基因“Null / Null”编码为999999,缺失值为“??”。通过以上四种测试中至少两种确定的基因座被保留并作为发散选择的候选基因座进行研究。

候选基因

为了通过同源性搜索确定候选基因,我们使用了共识遗传图谱的组合信息[33],实体地图[1]和全基因组霰弹枪(WGS)序列组装([35];http://www.phytozome.net)的亚麻。当候选基因座及其相邻的LD最高的标记(r2> 0.4)均位于相同的WGS序列组装支架上,我们估计了物理与遗传距离(Mb/cM),以确定候选基因鉴定需要研究的物理距离。当相邻标记在不同支架上或显示弱LD时(r2< 0.2),我们将候选基因的搜索限制在离群标记的上游和下游的10 KB区域。基于隐马尔可夫模型的基因寻找程序对WGS装配的注释[Augustus v.2.5.5]82和GlimmerHMM v.3.0.1 [83]被使用。使用BLASTn算法,在包含462,190个亚麻EST的内部亚麻EST数据库中搜索候选基因的预测开放阅读框([233458];NCBI亚麻属植物usitatissimumESTdb)作为表达的证据,使用e值截断值1e-5。使用相同的候选基因序列对UniProtKB数据库中的1600万个注释蛋白进行BLASTx搜索[84用e值截断值1e-5来提供蛋白质功能的证据。基因本体(GO)注释([40];http://www.geneontology.org)也从UniProtKB中检索。使用AgBase web服务器上的GO瘦身查看器,从与BLASTx基因注释相关的所有GO术语中获得了所有三个独立GO类别(即细胞成分、分子功能和生物过程)的植物GO瘦身([85];http://www.agbase.msstate.edu).

参考文献

  1. 1.

    Ragupathy R, Rathinavelu R, Cloutier S:物理映射和bac端序列分析提供了对亚麻(亚麻属植物usitatissimuml .)基因组。中国生物医学工程学报,2011,32(1):391 - 391。10.1186 / 1471-2164-12-217。

    PubMed中科院公共医学中心文章谷歌学者

  2. 2.

    Vavilov NI:栽培植物的起源、变异、免疫和育种。植物学刊,1995,13(1):1-3。

    谷歌学者

  3. 3.

    陈毅,陈勇,陈志强,陈志强。转基因作物概要。编辑:科尔C,霍尔TC。牛津:布莱克威尔出版有限公司:2008,199 -226。

    谷歌学者

  4. 4.

    Diederichsen A, Ulrich A: 1177株亚麻茎纤维含量的变异及其与其他性状的关系(亚麻属植物usitatissimumL)基因库接入。作物学报,2009,30(1):33-39。10.1016 / j.indcrop.2009.01.002。

    中科院文章谷歌学者

  5. 5.

    van Zeist W, baker - heeres JAH:公元前6000年前亚麻籽种植的证据。考古学报,1975,2(3):215-219。10.1016 / 0305 - 4403 (75) 90059 - x。

    文章谷歌学者

  6. 6.

    亚麻油和高亚麻酸油。贝利工业油脂产品第6版。编辑:Shahidi F. Hoboken: John Wiley & Sons, Inc ., 2001, 281-301。6

    谷歌学者

  7. 7.

    魏志强,陈志强,陈志强,等。亚麻籽木脂素在疾病预防和健康促进中的应用。植物化学,2003,2003(2):401-417。

    文章谷歌学者

  8. 8.

    Cullis C:油籽;亚麻;野生近缘作物:基因组和育种资源。编辑:Cole C. Berlin: Springer 2011, 177-189。

    谷歌学者

  9. 9.

    冯·库尔帕·W亚麻属植物usitatissimum[j] .科学通报,2002,31(3):341-388。

    谷歌学者

  10. 10.

    Diederichsen A:亚麻遗传多样性比较(亚麻属植物usitatissimumL.)在加拿大品种和世界品种之间。植物育种,2001,120(4):360-362。10.1046 / j.1439-0523.2001.00616.x。

    文章谷歌学者

  11. 11.

    Diederichsen A, Rozhmina TA, Zhuchenko AA, Richards KW: 96种亚麻的广泛适应性筛选(ei)亚麻属植物usitatissimumL.)在加拿大和俄罗斯干燥和温暖的条件下加入。植物遗传资源学报,2006,46(6):9-16。

    谷歌学者

  12. 12.

    Diederichsen A, Raney JP:种子颜色、种子重量和种子含油量亚麻属植物usitatissimum加拿大植物基因资源所持有的资料。植物育种,2006,125(4):372-377。10.1111 / j.1439-0523.2006.01231.x。

    文章谷歌学者

  13. 13.

    Tyson H, Fieldes MA, Cheung C, Starobin J:同工酶相对迁移率(Rm)与叶片位置的关系;明显平滑的Rm趋势和一些暗示。生物化学,1985,23(9):641-654。

    PubMed中科院谷歌学者

  14. 14.

    mamatnsby E, Diaz O, von Bothmer R:瑞典亚麻遗传多样性的初步研究(亚麻属植物usitatissimum).遗传资源作物学报,2000,47(4):417-424。10.1023 /: 1008721528588。

    文章谷歌学者

  15. 15.

    Spielmeyer W, Green AG, Bittisnish D, Mendham N, Lagudah ES:亚麻AFLP连锁图谱上抗枯萎病数量性状位点的鉴定(英文)亚麻属植物usitatissimum).理论与应用,1998,97(4):633-641。10.1007 / s001220050939。

    中科院文章谷歌学者

  16. 16.

    Everaert I, De Riek J, De Loose M, Van Waes J, Van Bockstaele E:亚麻和亚麻籽区别度评价的最相似品种分组(亚麻属植物usitatissimumL.)品种的AFLP和形态学资料。植物品种种子。2001,14(2):69-87。

    谷歌学者

  17. 17.

    傅彦斌,Diederichsen A, Richards KW, Peterson G:亚麻品种和地方品种的遗传多样性(亚麻属植物usitatissimumL)由rapd揭示。遗传资源作物学报,2002,49(2):167-174。10.1023 /: 1014716031095。

    文章谷歌学者

  18. 18.

    傅彦波,Rowland GG, Duguid SD, Richards KW: 54个北美亚麻品种的RAPD分析。作物科学,2003,43(4):1510-1515。10.2135 / cropsci2003.1510。

    文章谷歌学者

  19. 19.

    wiesnerov D, Wiesner I:基于issr的亚麻种质聚类与千粒质量的统计相关。生物工程学报,2004,26(3):207-213。10.1385 / MB: 26:3:207。

    PubMed文章谷歌学者

  20. 20.

    傅彦斌:栽培亚麻RAPD变异的地理格局。作物科学,2005,45(3):1084-1091。10.2135 / cropsci2004.0345。

    中科院文章谷歌学者

  21. 21.

    Diederichsen A, Fu YB:栽培亚麻4个种下类群的表型和分子(RAPD)分化(亚麻属植物usitatissimuml . subp。usitatissimum).遗传资源作物学报,2006,53(1):77-90。10.1007 / s10722 - 004 - 0579 - 8。

    中科院文章谷歌学者

  22. 22.

    diderichsen A, Fu BF:亚麻遗传多样性作为未来成功的原料。2008年,国际亚麻及其他麻类植物会议,[http://www.saskflax.com/documents/fb_papers/51_Diederichsen.pdf]

    谷歌学者

  23. 23.

    Cloutier S, Niu Z, Datla R, Duguid S:亚麻EST-SSRs的开发与分析(英文)亚麻属植物usitatissimuml .)。理论与应用,2009,19(1):53-63。10.1007 / s00122 - 009 - 1016 - 3。

    PubMed中科院文章谷歌学者

  24. 24.

    Rajwade AV, Arora RS, Kadoo NY, Harsulkar AM, Ghorpade PB, Gupta VS:印度亚麻基因型亲缘关系(亚麻属植物usitatissimumL.):简单序列重复(ISSR)引物测定。生物工程学报,2010,45(2):161-170。10.1007 / s12033 - 010 - 9256 - 7。

    PubMed中科院文章谷歌学者

  25. 25.

    Uysal H,傅彦斌,Kurt O, Peterson GW, Diederichsen A, Kusters P:栽培亚麻的遗传多样性(亚麻属植物usitatissimumL.)及其野生祖先淡亚麻(亚麻属植物比尔市), ISSR标记显示。遗传资源作物学报,2010,57(7):1109-1119。10.1007 / s10722 - 010 - 9551 - y。

    中科院文章谷歌学者

  26. 26.

    傅彦斌:亚麻荚膜开裂早期驯化的遗传证据。遗传资源作物学报,2011,58(8):1119-1128。10.1007 / s10722 - 010 - 9650 - 9。

    文章谷歌学者

  27. 27.

    Smỳkal P, Bačová-Kerteszová N, Kalendar R, Corander J, Schulman AH, Pavelek M:栽培亚麻的遗传多样性(亚麻属植物usitatissimumL.基于反转录转座子的标记评估种质资源。理论与应用,2011,22(7):1385-1397。10.1007 / s00122 - 011 - 1539 - 2。

    PubMed文章谷歌学者

  28. 28.

    Soto-Cerda BJ, Maureira-Butler I, Muñoz G, Rupayan A, Cloutier S:基于ssr的亚麻种群结构、分子多样性和连锁不平衡分析[j]。亚麻属植物usitatissimumL.)因浆液种皮含量而变化。动物学报,2012,30(2):875-888。10.1007 / s11032 - 011 - 9670 - y。

    文章谷歌学者

  29. 29.

    Cloutier S, Miranda E, Ward K, Radovanovic N, Reimer E, Walichnowski A, Datla R, Rowland G, Duguid S, Ragupathy R:亚麻细菌人工染色体末端序列的简单序列重复标记及其表达序列标记(亚麻属植物usitatissimuml .)。理论与应用,2012,25(4):685-694。10.1007 / s00122 - 012 - 1860 - 4。

    PubMed中科院公共医学中心文章谷歌学者

  30. 30.

    Diederichsen A:非原生境栽培亚麻(亚麻属植物usitatissimumL.)和其他种类亚麻属植物[j] .资源作物学报,2007,54(3):661-678。10.1007 / s10722 - 006 - 9119 - z。

    文章谷歌学者

  31. 31.

    库马尔,尤福明,克鲁提尔,等。基于下一代测序的亚麻基因组SNP发现。中国生物医学工程学报,2012,33(3):684。10.1186 / 1471-2164-13-684。

    PubMed中科院公共医学中心文章谷歌学者

  32. 32.

    Cloutier S, Ragupathy R, Niu Z, Duguid S:基于ssr的亚麻连锁图谱(亚麻属植物usitatissimumL.)和脂肪酸组成性状的qtl定位。动物学报,2011,28(4):437-451。10.1007 / s11032 - 010 - 9494 - 1。

    中科院文章谷歌学者

  33. 33.

    Cloutier S, Ragupathy R, Miranda E, Radovanovic N, Reimer E, Walichnowski A, Ward K, Rowland G, Duguid S, Banik M:亚麻遗传和物理图谱的综合共识(ei)亚麻属植物usitatissimuml .)。理论与应用,2012,25(8):1783-1795。10.1007 / s00122 - 012 - 1953 - 0。

    PubMed公共医学中心文章谷歌学者

  34. 34.

    冯格拉特,彭翔,邱森,Stone SL, Tibiche C, Cram D, Alting-Mees M, Nowak J, Cloutier S, Deyholos M, Bekkaoui F, Sharpe A, Wang E, Rowland G, Selvaraj G, Datla R:亚麻种子发育的基因表达分析。植物学报,2011,33(4):391 - 391。10.1186 / 1471-2229-11-74。

    PubMed中科院公共医学中心文章谷歌学者

  35. 35.

    王忠,Hobson N, Galindo L,朱山,史东,McDill J,杨丽,Hawkins S, Neutelings G, Datla R, Lambert G, Galbraith DW, Grassa CJ, Geraldes A, Cronk QC, Cullis C, Dash PK, Kumar PA, Cloutier S, Sharpe AG, Wong GK, Wang J, Deyholos MK:亚麻基因组(亚麻属植物usitatissimum)组装新创从短的鸟枪序列中读出。植物学报,2012,32(3):461-473。10.1111 / j.1365 - 313 x.2012.05093.x。

    PubMed文章谷歌学者

  36. 36.

    王晓明,王晓明,王晓明,等。植物连锁不平衡的研究进展。植物学报,2003,54(4):357-374。10.1146 / annurev.arplant.54.031902.134907。

    PubMed中科院文章谷歌学者

  37. 37.

    张志军,张志军,张志军,张志军,张志军。基因分型与基因设计的关系分析。植物细胞,2009,21(8):2194-2202。10.1105 / tpc.109.068437。

    PubMed中科院公共医学中心文章谷歌学者

  38. 38.

    Cornuet JM, Luikart G:从等位基因频率数据中检测近期种群瓶颈的两个测试的描述和功率分析。遗传学报,1996,34(4):591 - 591。

    PubMed中科院公共医学中心谷歌学者

  39. 39.

    Luikart G, Allendorf FW, Cornuet JM, Sherwin WB:等位基因频率分布的畸变为近期种群瓶颈提供了检验。中国生物医学工程学报,2009,35(3):344 - 344。10.1093 / jhered / 89.3.238。

    PubMed中科院文章谷歌学者

  40. 40.

    Ashburner M, Ball CA, Blake JA, Botstein D, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT, Harris MA, Hill DP, Issel-Tarver L, Kasarskis A, Lewis S, Matese JC, Richardson JE, Ringwald M, Rubin GM, Sherlock G:基因本体:生物学统一的工具。自然遗传,2000,25(1):25-29。10.1038/75556。

    PubMed中科院公共医学中心文章谷歌学者

  41. 41.

    Rachinskaya OA, Lemesh VA, Muravenko OV, Yurkevich OY, Guzenko EV, Bol’sheva NL, Bogdanova MV, Samatadze TE, Popov KV, Malyshev SV, Shostak NG, Heller K, Hotyleva LV, Zelenin AV:亚麻遗传多态性亚麻属植物usitatissimum基于分子细胞遗传学标记的使用。遗传学报,2011,47(1):56-65。

    中科院谷歌学者

  42. 42.

    马吉欧尼,李建平,李建平,等。亚麻种质资源研究进展。特设会议:2001年12月7日至8日。布拉格:国际植物遗传资源研究所:2002年。

    谷歌学者

  43. 43.

    Yu J, Pressoir G, Briggs W, Vroh Bi I, Yamasaki M, Doebley J, McMullen M, Gaut B, Nielsen D, Holland J, Kresovich S, Buckler E:一种多层次关联映射的统一混合模型方法。植物学报,2006,38(2):203-208。10.1038 / ng1702。

    PubMed中科院文章谷歌学者

  44. 44.

    Bernardo R, Romero-Severson J, Ziegle J, Hauser J, Joe L, Hookstra G, Doerge RW:玉米近交系亲本贡献和共祖系数:系谱、RFLP和SSR数据。理论与应用,2000,100(3-4):552-556。

    中科院谷歌学者

  45. 45.

    李建军,李建军,李建军,等。微卫星基因多态性的研究进展亚麻属植物usitatissimum.生物化学学报,2006,36(3):796-799。10.1111 / j.1471-8286.2006.01348.x。

    中科院文章谷歌学者

  46. 46.

    邓霞,龙松,何东,李霞,王勇,刘健,陈宏:水稻多态微卫星标记的开发与鉴定亚麻属植物usitatissimum.植物学报,2010,32(1):391 - 391。10.1007 / s10265 - 009 - 0271 - 3。

    PubMed中科院文章谷歌学者

  47. 47.

    杨建军,李建军,李建军,李建军,李建军,李建军。玉米微卫星基因筛选及其在玉米驯化过程中的应用。美国国家科学促进会。中国生物医学工程学报,2009,29(5):555 - 555。10.1073 / pnas.112324299。

    PubMed中科院公共医学中心文章谷歌学者

  48. 48.

    于静,李文杰,李文杰。玉米遗传关联定位与基因组组织。生物技术学报,2006,17(2):155-160。10.1016 / j.copbio.2006.02.003。

    PubMed中科院文章谷歌学者

  49. 49.

    Morrell PL, Toleno DM, Lundy KE, Clegg MT:野生大麦的低水平连锁不平衡(大麦芽ssp。spontaneum),尽管自花受精率很高。美国国家科学促进会。[j] .中国科学:地球科学。10.1073 / pnas.0409804102。

    PubMed中科院公共医学中心文章谷歌学者

  50. 50.

    肖勇,蔡东,杨伟,叶伟,尤纳斯梅,吴健,刘凯:一种油菜的遗传结构及连锁不平衡模式[J]。芸苔属植物显著L.微卫星显示的协会小组。理论与应用,2012,25(3):437-447。10.1007 / s00122 - 012 - 1843 - 5。

    PubMed中科院文章谷歌学者

  51. 51.

    Casa AM, Mitchell SE, Hamblin MT, Sun H, Bowers JE, Paterson AH, Aquadro CF, Kresovich S:高粱的多样性和选择:使用简单序列重复的同时分析。理论与应用,2011(1):23-30。

  52. 52.

    李建军,李建军,李建军,李建军,李建军,李建军,李建军,李建军,李建军,李建军,李建军,李建军,李建军。PLoS ONE。2009, 4 (8): e6595。10.1371 / journal.pone.0006595。

    PubMed公共医学中心文章谷歌学者

  53. 53.

    王晓明,王晓明,王晓明,王晓明,等。基于证据选择和关联分析的奶牛综合性状检测方法研究进展。中国生物医学工程学报,2012,13(3):448。10.1186 / 1471-2164-13-48。

    PubMed公共医学中心文章谷歌学者

  54. 54.

    Shimada Y, Shikano T, Merilä J:三棘棘鱼生理重要基因的高选择性,Gasterosteus aculeatus.中华生物医学杂志,2011,28(1):181-193。10.1093 / molbev / msq181。

    PubMed中科院文章谷歌学者

  55. 55.

    何小春,秦彦明,徐勇,胡云云,朱永勇:棉花胚珠中19个β-微管蛋白cdna的克隆、表达谱分析及酵母互补。实验学报,2008,59(10):2687-2695。10.1093 / jxb / ern127。

    PubMed中科院公共医学中心文章谷歌学者

  56. 56.

    Roach MJ, Deyholos MK:发育中的亚麻下胚轴的微阵列分析发现与韧皮部纤维分化的特定阶段相关的新转录本。中国生物医学工程学报,2008,32(3):317-330。10.1093 / aob / mcn110。

    PubMed中科院公共医学中心文章谷歌学者

  57. 57.

    Sexton TR, Henry RJ, Hardwood CE, Thomas DS, McManus LJ, Raymond C, Henson M, Shepherd M:果胶甲基转移酶基因对实木性能的影响桉树pilularis.植物生理学报,2011,31(1):531-541。

    PubMed公共医学中心文章谷歌学者

  58. 58.

    Fenart S, Ndong YP, Duarte J, rivi N, Wilmer J, van Wuytswinkel O, Lucau A, Cariou E, Neutelings G, Gutierrez L, Chabbert B, Guillot X, Tavernier R, Hawkins S, Thomasset B:亚麻(亚麻属植物usitatissimumL.基因表达寡核苷酸芯片。中国生物医学工程学报,2010,11(1):592。10.1186 / 1471-2164-11-592。

    PubMed公共医学中心文章谷歌学者

  59. 59.

    邓霞,龙松,何东,李霞,王勇,郝东,邱晨,陈旭:亚麻多态微卫星标记的分离与鉴定(英文)亚麻属植物usitatissimuml .)。生物技术学报,2011,10(5):734-739。

    中科院谷歌学者

  60. 60.

    曼利BFJ:自然选择的统计。由于距离隔离而产生的假测试结果。伦敦:查普曼和霍尔出版社:1985,186 -195。

    谷歌学者

  61. 61.

    叶锋锋,杨荣成,Boyle TBJ,叶振华,毛建新:群体遗传分析共享软件POPGENE。分子生物学和生物技术中心:阿尔伯塔大学出版社:1997年。

    谷歌学者

  62. 62.

    nem:细分人群的基因多样性分析。美国国家科学促进会。中国生物医学工程学报,2009,30(6):391 - 391。10.1073 / pnas.70.12.3321。

    PubMed中科院公共医学中心文章谷歌学者

  63. 63.

    刘凯,王晓华,王晓华,等。基于遗传标记分析的PowerMarker集成分析环境。生物信息学,2005,21(9):2128-2129。10.1093 /生物信息学/ bti282。

    PubMed中科院文章谷歌学者

  64. 64.

    李建军,李建军,李建军,李建军,等。基于最大似然、进化距离和最大简约性的分子进化遗传分析。中华生物医学杂志,2011,28(10):2731-2739。10.1093 / molbev / msr121。

    PubMed中科院公共医学中心文章谷歌学者

  65. 65.

    Yunusbayev B, Metspalu M, Järve M, Kutuev I, Rootsi S, Metspalu E, Behar DM, Varendi K, Sahakyan H, Khusainova R, Yepiskoposyan L, Khusnutdinova EK, Underhill PA, Kivisild T, Villems R:古代人类迁移的非对称半渗透性屏障。中华生物医学杂志,2011,29(1):359-365。

    PubMed文章谷歌学者

  66. 66.

    GGT 2.0:用于可视化和分析遗传数据的通用软件。[J] .中国生物医学工程学报,2008,29(2):379 - 379。10.1093 / jhered / esm109。

    PubMed中科院文章谷歌学者

  67. 67.

    Peakall R, Smouse PE: GENALEX 6:基因分析。用于教学和研究的种群遗传软件。生物化学学报,2006,31(1):389 - 389。10.1111 / j.1471-8286.2005.01155.x。

    文章谷歌学者

  68. 68.

    Pritchard JK, Stephens M, Rosenberg NA, Donnelly P:结构群体的关联映射。[J] .中国生物医学工程学报,2000,67(1):170-181。10.1086/302959。

    PubMed中科院公共医学中心文章谷歌学者

  69. 69.

    Hubisz MJ, Falush D, Stephens M, Pritchard JK:基于样本组信息的弱种群结构推断。中国生物医学工程学报,2009,29(5):1322-1332。10.1111 / j.1755-0998.2009.02591.x。

    PubMed公共医学中心文章谷歌学者

  70. 70.

    李建军,李建军,李建军,等。基于结构的个体集群数量检测方法研究。中国生物医学工程学报,2005,35(8):2611-2620。10.1111 / j.1365 - 294 x.2005.02553.x。

    PubMed中科院文章谷歌学者

  71. 71.

    一个人口结构的图形显示程序。生物化学学报,2004,31(1):387 - 398。

    文章谷歌学者

  72. 72.

    王晓明,王晓明。遗传多样性对遗传多样性管理的影响。植物保护,2002,3(3):289-299。10.1023 /: 1019956205473。

    中科院文章谷歌学者

  73. 73.

    gutierrz JP, Royo LJ, álvarez I, Goyache F: MolKin v. 2.0:一个利用分子协入口信息进行群体遗传分析的计算机程序。中国生物医学工程学报,2009,35(6):718-721。10.1093 / jhered / esi118。

    PubMed文章谷歌学者

  74. 74.

    Kalinowski ST: HP-RARE 1.0:一个对等位基因丰富度进行度量的计算机程序。生物化学学报,2005,35(1):187-189。10.1111 / j.1471-8286.2004.00845.x。

    中科院文章谷歌学者

  75. 75.

    Breseghello F, Sorrells M:小麦籽粒大小与制粉品质的关联图谱(小麦l .)品种。遗传工程学报,2006,32(2):1155 -1177。

    PubMed公共医学中心文章谷歌学者

  76. 76.

    Watterson GA:中性的纯合性检验。遗传学报,2009,35(2):444 - 444。

    PubMed中科院公共医学中心谷歌学者

  77. 77.

    Kauer MO, Dieringer D, Schlötterer C:与“走出非洲”生境扩张相关的正选择微卫星变异性筛选黑腹果蝇.遗传学报,2009,35(3):1177 - 1177。

    PubMed中科院公共医学中心谷歌学者

  78. 78.

    Beaumont MA, Nichols RA:评价基因座在群体结构遗传分析中的应用。中国生物医学工程学报,1997,26(3):444 - 444。10.1098 / rspb.1996.0237。

    文章谷歌学者

  79. 79.

    Antao T, Lopes A, Lopes RJ, Beja-Pereira A, Luikart G:基于第一离群值法的LOSITAN分子适应检测平台。生物信息学杂志,2008,9:323。10.1186 / 1471-2105-9-323。

    PubMed公共医学中心文章谷歌学者

  80. 80.

    李建军,李建军,李建军,等。基于遗传算法的遗传多样性研究。遗传学报,2009,43(4):285-298。10.1038 / hdy.2009.74。

    PubMed中科院文章谷歌学者

  81. 81.

    埃克菲耶·L,利舍尔·HEL:阿勒昆组曲。3.5:在Linux和Windows下执行种群遗传学分析的一系列新程序。中国生物医学工程学报,2010,35(3):564-567。10.1111 / j.1755-0998.2010.02847.x。

    PubMed文章谷歌学者

  82. 82.

    Stanke M, Diekhans M, Baertsch R, Haussler D:利用天然和同步定位的cDNA比对来改进新创基因的发现。生物信息学,2008,24(5):637-644。10.1093 /生物信息学/ btn013。

    PubMed中科院文章谷歌学者

  83. 83.

    马洛斯,吴建军,李建军,等。TigrScan和GlimmerHMM:两个开源的从头开始真核基因查找器。生物信息学,2004,20(16):2878-2879。10.1093 /生物信息学/ bth315。

    PubMed中科院文章谷歌学者

  84. 84.

    UniProt联盟:通用蛋白质资源(UniProt) 2009。核酸学报,2009,37:D169-D174。

    公共医学中心文章谷歌学者

  85. 85.

    McCarthy FM, Wang N, Magee GB, Nanduri B, Lawrence ML, Camon EB, Barrell DG, Hill DP, Dolan ME, Williams WP, Luthe DS, Bridges SM, Burgess SC: AgBase:农业功能基因组资源。中国生物医学工程学报,2006,32(2):444 - 444。10.1186 / 1471-2164-7-229。

    PubMed公共医学中心文章谷歌学者

下载参考

致谢

作者感谢Andrzej Walichnowski、Evelyn Miranda和Yelena Shmelov提供的技术援助。克劳蒂尔实验室的成员也因开发了微卫星标记和一致的亚麻遗传图谱而受到认可。这项工作是由加拿大基因组局资助、马尼托巴省政府、加拿大亚麻理事会和马尼托巴亚麻种植者协会共同资助的全面利用亚麻基因组学(TUFGEN)项目的一部分。同时也感谢Genome Prairie对项目的管理和支持。布劳里奥·索托-塞尔达得到了智利国家基金会Comisión Investigación Científica y Tecnológica (CONICYT)的支持。

作者信息

从属关系

作者

相应的作者

对应到西尔维克劳蒂尔在

额外的信息

相互竞争的利益

作者宣称他们没有竞争利益。

作者的贡献

BJSC将这项工作作为他博士论文的一部分。他进行了分析,解释了数据,并参与撰写了手稿。AD对亚麻核心藏品进行了鉴定和开发。RR进行基因预测和基因注释。SC设计了这项研究,生成了数据,监督了这项工作,并共同撰写了手稿。所有作者都认真地审阅了手稿。所有作者都阅读并批准了最终的手稿。

电子补充资料

12870 _2012_1283_moesm1_esm.pdf

附加文件1:表S1:(可移植文件格式文件)根据邻居连接树排序的407个亚麻接入列表。(pdf 285kb)

一个

附加文件2:图S1:(可移植文件格式文件)()基于259个LD < 0.4的中性ssr对核心收集的407个亚麻品种进行主坐标分析(PCoA)。根据NJ分析结果对亚组进行标记(图1a)。(b)成对地通过NJ、STRUCTURE和PCoA分析推断出亚麻6个亚群之间的差异。1 =北美2 =东欧3 =南亚4 =西欧5 =北美/欧洲南美洲。*显著值P < 0.001。(pdf 189kb)

一个

附加文件3:图S2:纤维亚麻和亚麻籽类群的种群结构和连锁不平衡分析(便携式文档格式文件)。(1)贝叶斯聚类分析(STRUCTURE)K= 2)纤维亚麻和亚麻籽。(b)特别统计ΔK62]K取值范围为1 ~ 4。(c)全基因组平均LD衰减(r2)对纤维和亚麻类群遗传距离(cM)的影响。黑线表示两个亚麻类群在基因组水平上的衰减曲线。(pdf 214kb)

12870 _2012_1283_moesm4_esm.pdf

附加文件4:表S2:(可移植文件格式文件)亚麻和亚麻类群间差异选择影响的候选基因分析。绿色:BLASTx命中与UniProtKB(没有命中),蓝色:BLASTx命中与UniProtKB(少于34个氨基酸或35%相似),红色:BLASTn命中与亚麻- ests(没有命中),黄色:BLASTn命中与亚麻- ests(少于80 bp或80%相似)。(pdf 296kb)

一个

附加文件5:图S3:(可移植文档格式文件)从亚麻纤维和亚麻籽群体之间的9个非中性候选基因组区域预测的基因产物的GO-slim注释。(1)分子功能。(b)生物过程。(c)细胞成分。(pdf 578kb)

12870 _2012_1283_moesm6_esm.pdf

附加文件6:表S3:(可移植文档格式文件)核心收集数据包括入库编号、入库名称、来源和改进情况。CN =加拿大编号,加拿大植物基因资源(PGRC)。(pdf 228kb)

一个

附加文件7:图S4:(可移植文件格式文件)核心馆藏407个亚麻品种的分布。(1)地理来源。(b)改进状态。(pdf 260kb)

作者提交的原始图片文件

下面是作者提交的原始图片文件的链接。

图1的作者原始文件

图2的作者原始文件

权利和权限

开放获取本文由BioMed Central Ltd.授权发表。这是一篇开放获取的文章,在知识共享署名许可(https://creativecommons.org/licenses/by/2.0),允许在任何媒体上不受限制地使用、分发和复制,前提是正确引用原创作品。

转载及权限

关于本文

引用本文

Soto-Cerda, b.j., Diederichsen, A, Ragupathy, R。et al。亚麻核心种质的遗传特征分析(亚麻属植物usitatissimumL.)适合于关联制图研究和纤维和亚麻籽类型间不同选择的证据。BMC Plant Biol13日,78(2013)。https://doi.org/10.1186/1471-2229-13-78

下载引用

  • 收到了

  • 接受

  • 发表

  • DOIhttps://doi.org/10.1186/1471-2229-13-78

关键字

  • 遗传多样性
  • 人口结构
  • 连锁不平衡
  • 关联映射
  • 亚麻属植物usitatissimum
  • 亚麻纤维
  • 亚麻籽
  • 不同的选择