摘要
背景
遗传作图已经被证明是研究复杂性状遗传结构的有力手段,它刻画了潜在的相互作用数量性状位点(qtl)网络。目前的遗传定位统计模型大多建立在qtl的双等位互作基础上,尚不能对异交群体中广泛存在的多等位qtl及其互作进行分析。
结果
在此,我们建立了一个通用框架来建模和定义多等位qtl之间的上位性。基于这一框架,我们推导出了一种统计算法,用于估计和检验异交种全同胞家族不同qtl间的多等位互作。利用该算法对两种杂合子杨树远交的一个生根能力性状的多等位基因上位性分布进行了全基因组扫描。模拟研究结果表明,多等位qtl的位置和效应可以很好地估计,样本和遗传力适中。
结论
开发的模型和算法提供了一种有用的工具,以便更好地表征衍生自森林树的杂合族的复杂性状的复杂性状的遗传控制,从而填补该组重要但不足的物种的遗传映射中发生的差距.
背景
针对回交、双单倍体、ril和F . l .等试验组合,初步建立了QTL定位方法2,源自近交系[1-3.].由于自交系的纯合子,可以直接观察到各种标记的所有标记物的孟德尔(CO)分离,可以直接观察到这种十字架中的两个替代等位基因。在实践中,还有一组巨大的经济性和环境重要性 - 交叉口种类,如森林树木,其中传统的QTL映射方法不能适当地使用。对于这些物种,由于长产生间隔和高杂合子,难以或不可能产生自交系[4.尽管实验性杂交品种已经在实际育种项目中得到了商业应用。
对于一个给定的远交系,一些标记可能是杂合的,而另一些标记可能是纯合的。所有标记可以,也可以不,有相同的等位基因系统之间的任何两个远交系用于杂交。同时,对于一对杂合位点,其沿两条同源染色体的等位基因配置(即连锁期)不能从杂交的基因型分离模式中观察到[5.那6.].遗憾的是,不同标记的一致数量和其已知的联动阶段是对回复或F的统计映射方法的先决条件2.Grattapaglia和Sederoff [7.]提出了一种所谓的伪测试回流策略,用于两个差异父母之间的受控交叉中的连接映射。该策略对于那些在一个父母和零核中的测试克罗斯标志物的链接分析是强大的,尽管它未能考虑许多用于交叉交叉的交叉标记和显性标记。Maliepaard等。[8.],通过正确确定标记的连锁阶段,推导出了许多估计不同类型标记间连锁的公式。已建立了一个通用模型,用以同时估计异交群体中任何标记杂交类型的连锁和连锁阶段[9.那10].斯塔姆(11]编写了强大的软件,利用不同类型的标记整合遗传连锁图谱。
全SIB家族中QTL映射的统计方法尚未得到充分的关注。林等。[12开发了一个模型,该模型考虑了基因组中等位基因数量的不确定性。Wu et al. [13]使用此模型来重新分析杨树的全SIB系列数据[14],从而发现了传统方法未发现的新的生物量性状qtl。随着对上位性在控制和维持数量变化中的作用的日益认识[15,将Lin等人的模型扩展到qtl的上位性图谱,从而对一个数量性状的遗传结构进行详细和全面的阐述是至关重要的。然而,公认的上位性理论和模型大多基于双等位基因[16[他们的估计和测试是针对来自自交系的血统进行了[17].到目前为止,还没有模型和算法来描述异交群体中多等位qtl的上位性。
在本文中,我们将扩展双倍超越的理论,以模拟不同QTL之间的超越,每个等位基因都有多个等位基因。然后基于混合模型实现多晶型背景理论的QTL映射统计模型。我们已经衍生了一种封闭的形式,用于估计Mureallelic QTLS在EM框架内的主要和交互式效果。我们的模型允许遗传学家测试个体遗传成分对特质变异的影响。通过模拟研究研究了估计模型,并通过杨树树的QTL映射的示例进行了验证[18].该算法已经被打包到一个新开发的软件3FunMap中,该软件用于绘制全同胞家族中的qtl [19].
数量遗传模型
添加剂 - 优势模型
随机选择两个杂合线作为父母p1和P.2为了生产全脂系列,其中QTL如果两条线具有完全不同的等位基因系统,则QTL将形成四种基因型。让我们μ.紫外线为价值QTL基因型遗传等位基因你(u =1,2)来自父母p1和等位基因V.(V.来自父p的3,4)2.基于定量遗传理论,这种基因型值可以分配给添加剂和显性效果,如下:
在哪里μ.整体意味着,α.你和βV.等位基因(添加剂)效果等位基因你和V.分别为,γ.紫外线是QTL的互动(主导)效应。考虑到两个父母之间的所有可能的等位基因和等位基因组合,总共有四种添加剂效应(α.1和α.2来自父母的p.1和β3.和β4.来自父母的p.2和四种主导效应(γ.13那γ.14那γ.23和γ.34).但这些加性和显性效应不是独立的,因此是不可估量的。参数化后,有两个独立的加性效应,α.=α.1= -α.2和β3.=β3.= -β4.,一个主要的影响,γ.=γ.13= -γ.14= -γ.23=γ.24,以估计。
让我们你= (μ.紫外线)4×1和A.= (μ,α,β,γ)T.,可以通过设计矩阵连接D..我们有
在哪里
a的表达式可以由的表达式得到你由
Additive-dominance-epistatic模型
如果在全同胞家族中存在两个分离的QTL,则需要考虑其非等位互作的上位性效应。近亲繁殖家庭的上位论[16可以很容易地扩展到指定远系杂交的不同上位性成分。考虑两个上位性多等位QTL,每个QTL在远交后代中有4个不同的基因型,13、14、23和24。让我们是QTL基因型的基因型值你1V.1/你2V.2为你1那你2= 1,2和V.1那V.2= 3,4和是相应的均值向量。将2个qtl基因型值划分为以下不同的组分:
在哪里
- (1)
μ.总体意思是;
- (2)
α.1为第一个QTL上等位基因1 ~ 2的替换所产生的加性效应;
- (3)
β1为第一个QTL上等位基因3 ~ 4的替换所产生的加性效应;
- (4)
γ.1由于来自不同父母的等位基因之间的相互作用,是主要的效果;
- (5)
α.2为第二个QTL上等位基因1 ~ 2的替换所产生的加性效应;
- (6)
β2是由于等位基因3 ~ 4在第二个QTL上的替换而产生的加性效应;
- (7)
γ.2由于来自不同父母的等位基因之间的相互作用,是主要的效果;
- (8)
我αα是添加剂×添加性认证效果,因为在第一和第二QTLS的等位基因1至2之间的取代之间的相互作用;
- (9)
我αβ是第1个QTL等位基因1 ~ 2与第2个QTL等位基因3 ~ 4的替换相互作用的加性×加性上位性效应;
- (10)
我βα是添加剂×添加性认识效果,因为在第一个QTL在第一个QTL处的等位基因3至4的子排与第二QTL的等位基因1至2之间的亚排之间的相互作用;
- (11)
我αβ为加性×加性上位性效应,这是由于等位基因3 ~ 4在第1和第2个qtl上的取代相互作用;
- (12)
jαγ由于在第一个QTL处的等位基因1至2的取代之间的取代与第二QTL的显性效果之间的取代与第二QTL的显性效果之间的相互作用,是显性×主导官方效果;
- (13)
jβγ是添加剂×显性性认证效果,因为在第一个QTL处的等位基因3至4之间的取代与第二QTL处的显性效果之间的取代之间的相互作用;
- (14)
K.γα是主要的×添加性认识效果,因为在第二QTL在第二QTL处的等位基因1至2的取代之间的显性效果与来自等位基因1至2的取代之间的相互作用;
- (15)
K.γβ是主要的×添加性认证效果,由于第一个QTL的主效应与第二QTL等等位基因3至4的取代之间的相互作用;
- (16)
L.γγ是主要的×主导剖面效果,因为第一和第二QTLS的主效应之间的相互作用。
两个相互作用QTL的遗传效果参数排列A.= (μ,α1那β1那γ.1那α.2那β2那γ.2那我αα那我αβ那我βα那我ββ那jαγ那jβγ那K.γα那K.γβ那L.γγ)T..将基因型值载体和基因效应载体联系起来
在设计矩阵
因此,就基因型值载体,遗传效应载体可以表达,如
如果我们有等位基因1 = 3和2 = 4,对于脱近的家庭,方程式1和3.将分别简化为传统的双等位基因加性-显性和双等位基因加性-显性-上位性遗传模型[20.].
统计模型
可能性
假设有一个全SIB系列的大小N来自两个交流线。考虑两种相互作用的QTL用于定量特征。让我们你1V.1和你2V.2分别在QTL 1和2处表示一般基因型,其中你1和你2(你1那你2= 1,2)是从父p的等位基因1和V.1和V.2(V.1那V.2= 3,4)是父母p继承的等位基因2.特征值的线性模型(y我)对于个人来说我受两个qtl的影响记为
在哪里如果一个特定的基因型,QTL基因型的指示变量是否定义为1你1V.1/你2V.2是针对个人的我否则是0E.我残差是否正态分布,均值为0,方差为0σ.2.个人的概率我携带QTL基因型你1V.1/你2V.2可以从其标记基因型推断出,此条件概率表示为[20.].
赋予特征价值的推定QTL的日志可能性(y)和标记信息(m)给出
其中θ是未知参数的向量,该参数包括条件概率表示的QTL位置, QTL基因型值和残差方差(σ.2).第一个参数,由θ表示P.,包含在上述模型的混合比例中,而第二两个,由θ表示问:,是数量遗传参数。正态分布密度也意味着和方差σ.2.
EM算法
提出了标准EM算法来获取未知向量的估计。通过微分方程(6.)关于两组未知参数(θP.,θ.问:),我们有
我们定义
哪个可以被认为是一个人的后验概率我有一个QTL基因型你1V.1/你2V.2.
在e步骤中,根据个体的标记基因型计算QTL基因型的后验概率我由方程(7.).在M步骤中,通过解决来估计未知参数的最大似然估计(MLES).估计基因型值和残差的封闭形式为
通过为参数提供初始值,迭代E和M步骤,直到估计稳定。稳定值是未知参数的MLE。注意,可以通过处理定位来估计标记间隔内的QTL位置。使用网格搜索,我们可以从染色体上的日志似然比测试统计数据的峰值从QTL位置获得QTL位置的MLE。
假设测试
参数估计后,可以进行若干假设检验。通过将原假设表述为,可以检验QTL是否存在
减少的可能性(H.0.)和完整的模型(H.1),然后估计其对数似然比(LR)
彩光灯和帽子是下面的马尔斯H.0.和H.1分别。声明QTL存在的临界阈值可以从排列测试凭经验确定[21].
对不同遗传效应(包括添加剂)的假设检验(α.1那β1那α.2那β2),占主导地位的(γ.1那γ.2)和添加剂×添加剂(我αα那我αβ那我βα那我ββ),添加剂×主导(jαγ那jβγ),主导×添加剂(K.γα那K.γβ)和显性×显性(L.γγ)可以配制的背景效果,其中相应的NULL假设:
在每个零假设下,基因型值应该受到限制
为H.0.:α.1= 0,
为H.0.:β1= 0,
为H.0.:α.2= 0,
为H.0.:β2= 0,
为H.0.:γ.1= 0,
为H.0.:γ2= 0,
为H.0.:我αα= 0,
为H.0.:我αβ= 0,
为H.0.:我βα= 0,
为H.0.:我ββ= 0,
为H.0.:jαγ= 0,
为H.0.:jβγ= 0,
为H.0.:K.γα= 0,
为H.0.:K.γβ= 0,
为H.0.:L.γγ分别= 0。这些约束中的每一个利用如上所述的EM算法实现,这将导致满足方程的基因型值的MLE(11) -(25)。每个试验(11)-(25)的临界阈值可以从模拟研究中确定。
结果
一个有效的例子
我们使用一个真实的森林树的例子来说明我们的多等位基因认知性QTL定位方法在一个远亲群体。材料为种间F1混合之间的人口Populus deltoides.(P1),p . euramericana(P2).为QTL映射选择了总共86个个体。通过使用74 SSR标记的分离基因型12×34的标记构建遗传键,该标记覆盖全基因组的822.35cm并含有14个连杆基团。测量了每切割(TNR)的根部总数,并显示出在水培养的外来发展阶段的杂交种群的大变化。
通过对这些连锁群的系统搜索,多等位espistatic模型在5%显著性水平上鉴定了6对来自不同群体的TNR的显著qtl(图1).通过1000次排列试验确定了断言存在一对相互作用qtl的组×组范围LR阈值。联动组2中存在多个包含qtl的区域,qtl分布在L2_G_3592和L2_O_10、L2_P_422和L2_P_667、L2_P_667和L2_G_876、L2_O_286和L2_O_222标记之间。这些qtl通过相互作用或与4、7、12、14连锁群上的qtl形成5个上位性组合(见表1)1).第六对来自连接基团6和12。
表格1给出六对相互作用QTL的遗传效果参数的估计。在QTLS on Linkage组2,父母p . euramericana倾向于对根数产生不利等位基因,如许多阴性等位基因所见β值,虽然此父母显示比父级更好的生根容量P. deltoides..在这些qtl中,亲本P. deltoides.通常为小效果有助于根系,如小α.值。在连锁群6的QTL上,该亲本引发了较大的正加性效应。有趣的是,从总体上看,来自这两个父母的等位基因之间有明显的相互作用γ.价值观,暗示统治生根能力的重要性。在许多情况下,添加剂×添加性认证效果很重要,如许多大的所示我值。我们的模型可以进一步辨别哪种添加剂×添加剂外观贡献。例如,来自连杆组2之间的QTL之间的添加剂×添加剂是由于父母的等位基因之间的相互作用p . euramericana而对于连锁群2和14的QTL对,这是由于来自亲本的等位基因之间的相互作用P. deltoides..也可以识别QTL如何彼此相互作用的模式×显性,显性×添加剂和显性×显性超越超声(表1).
蒙特卡罗模拟
我们进行了仿真研究,以研究多晶型外观模型的统计学性质。我们模拟了从两个销售父母的全SIB的样本大小400,800和2000系列。在100厘米长的连杆组的不同位置假设两个QTL,具有6个偶数间隔的标记。模拟每种单独的定量性状的表型值作为这些QTLS加上正常分布的误差的基因型值(扩大为具有不同的遗传性,0.1和0.4)。基因型值以遗传行为和与表格中的真实值的相互作用表示2.
发现QTL位置可以使用我们的模型来估计(表2).单个qtl的加性效应和加性×加性上位性效应即使在适度的样本量用于适度的遗传力时也可以合理估计。其他遗传效应参数,特别是显性×显性上位性效应,尤其在遗传力较低的情况下,需要较大的样本量才能合理估计。由于涉及的参数很多,异交设计需要比回交或F2设计。
讨论
过去二十年来对开发由着陆器和博特汀(1989年)开创的间隔映射启发的复杂性状的QTL映射的统计模型巨大兴趣[2那3.那17那22-25].然而,在环境和经济上具有重要意义的物种群体——远交群体中QTL定位模式的建立[26],没有得到充分的关注。在outcrossing物种中只有几个出版物可用于QTL映射[12那13].在这篇文章中,我们提出了一个定量遗传模型来研究多等位qtl的上位性,以及一个计算算法来估计和检验上位性互作。
QTL映射的QTL映射的核心问题是如何在不同QTL的多个等位基因之间模拟遗传行为和相互作用。已经开发了传统的定量遗传模型,用于双腿遗传效果[16]他们对多级案例的延伸尚未明确探索。本研究首次尝试尝试表征多级QTL之间的剖面相互作用,该QTL普遍交出群体。我们根据等位基因的不同父母来分区每个QTL的添加剂效应到两个子组件中。同样,我们将添加剂×添加剂简化分为四个不同的子组件,添加剂×显性超越分为两个子组件,以及基于不同父母起源等位基因的相互作用,将显性×添加剂简化分为两个子组件。这些子组件具有独特的生物含义,因为它们来自不同的父母。在实践中,在两个遗传父母父母之间进行杂交,因此了解这些子组分中的每一个有助于研究杂种优势的遗传基础。
我们通过仿真研究测试了新的多级梅雷elic超越模型。通常,由于涉及许多参数,需要更大的样本大小来获得用于在outcrossing群体中的QTL映射的合理精确估计。根据我们的经验,通过精确的表型观察来增加特征的可遗传性可以改善比增强实验尺度的参数估计和模型力量。我们建议对现场管理提供更多的努力,可以提高表型测量质量而不是实验尺寸。通过分析来自杨树遗传学研究的真实数据,新模型得到了很好的验证。有趣的是发现来自不同杨树物种的等位基因之间的相互作用基本上促使来自切屑的能力,大于单独操作的等位基因的遗传效应。这种结果可能有助于了解优势在介质杂种中的作用。
结论
我们建立了一个统计模型来定位异交种全同胞家族的互作qtl。利用传统的数量遗传理论,我们定义了两个异交多等位qtl间相互作用的上位性成分。在此基础上,提出了一种估计异交上位性和检验异交上位性对数量性状控制作用的算法。该模型为研究异交物种(如森林树木)复杂性状的遗传结构提供了一个有用的工具,并填补了这组重要但代表性不足物种的遗传图谱的空白。
参考资料
- 1.
Lander ES,Botstein D:使用RFLP联系地图映射孟德尔因子的定量性状。遗传学。1989,121:185-199。
- 2.
ZENG ZB:定量特质基因座的精确映射。遗传学。1994年,136:1457-1468。
- 3.
Lynch M,Walsh B:遗传学和分析Sinauerassociates,Sunderland,MA;1998年。
- 4.
Wu Rl,Zeng Zb,Mckend Se,O'Malley DM:林木繁殖中分子映射的案例。植物品种Rev. 2000,19:41-68。
- 5.
李志刚,李志刚,李志刚:植物亲本间杂交重组频率的估计及RFLP连锁图谱的构建。遗传学。1999,125:645-654。
- 6.
同种异体植物杂交组合重组频率的计算及其在连锁定位中的应用。中国科学(d辑:地球科学)10.1017 / S0016672300033474。
- 7.
Gratepaglia D,Sederoff Rr:遗传联系地图桉树祖母和桉树尿尿使用伪测试杂交:mapping策略和RAPD标记。遗传学。1994,137:1121-1137。
- 8.
Maliepaard C,Jansen J,Van Ooijen JW:全套植物物种的全套家庭中的联动分析:概述和应用的后果。Genet Res。1997,70:237-250。10.1017 / s0016672397003005。
- 9.
吴瑞林,马彩霞,Painter I,曾志斌:异交种连锁和连锁阶段的同时最大似然估计。《中华流行生物学杂志》,2002,61:349-363。10.1006 / tpbi.2002.1577。
- 10。
Lu Q,Cui Yh,Wu RL:全SIB家族中联动,父母族肽和基因令联合建模的多点似然方法。BMC Genet。2004年,5:20。
- 11.
Stam P:利用新的计算机软件包JoinMap构建遗传连锁图谱。植物学报1993,3:739-744。10.1111 / j.1365 - 313 x.1993.00739.x。
- 12.
林M,Lou XY,Chang M,Wu RL:用于在非模型系统中映射定量特征基因座的一般统计框架:用于表征链接阶段的问题。遗传学。2002,165:901-913。
- 13.
吴松,杨军,黄玉杰,李勇,尹涛,伍尔施莱格,Tuskan GA,吴瑞林:杨树基因组数量性状位点定位的一种改进方法。生物信息学。2010,4:1-8。
- 14.
wlschleger SD, Yin TM, DiFazio SP, Tschaplinski TJ, Gunter LE, Davis MF, Tuskan GA:杂交杨树(Populus spp.)两个后代家系生长和生物量分配的表型变异。引用本文:王志刚,王志刚。2005,5:1779-1789。
- 15.
Whitlock MC, Phillips PC, Moore FBG, Tonsor SJ:多个健身高峰和上位。《生态学杂志》,1995,26:601-629。10.1146 / annurev.es.26.110195.003125。
- 16.
《生物特征遗传学》。查普曼和霍尔伦敦;,3 1982。
- 17.
Kao Ch,Zeng Zb:使用Cocker-Ham的模型建模定量特质基因座的简历。遗传学。2002,160:1243-1261。
- 18.
张B,Tong Cf,Yin TM,张XY,Zhuge Q,Huang Mr,Wang MX,Wu RL:使用功能映射的杨树中不定根增长轨迹的定量特质基因座的检测。树遗传学基因组。2009,5:539-552。10.1007 / s11295-009-0207-z。
- 19.
《生物特征遗传学》。查普曼和霍尔伦敦;,3 1982。
- 20。
Wu RL, Ma CX, Casella G:数量性状的统计遗传:LinkageMaps和QTL Springer-Verlag, New York;2007.
- 21。
Churchill Ga,Doerge RW:定量特质映射的经验阈值。遗传学。1994,138:963-971。
- 22。
易乃杰,徐淑珍,李丽娟。基于贝叶斯模型的数量性状位点定位研究。基因工程学报。2003,32(4):483 - 483。
- 23.
Broman KW:在表型分布中一个穗的情况下绘制数量性状位点。基因工程学报。2003,27(3):369 - 372。
- 24.
邹飞,聂立国,王立军,王立军。一种基于遗传算法的QTL定位方法。[J] .统计与决策。2009,39:978-989。10.1016 / j.jspi.2008.06.009。
- 25.
Cheng Jy,Tzeng SJ:用于绘制定量特质基因座的参数和半粉剂方法。Computat Stat数据分析。2009,53:1843-1849。10.1016 / J.CSDA.2008.08.026。
- 26.
杨树生长发育的分子遗传学研究。IV.定位对林木生长、形态和物候性状有较大影响的qtl。遗传学报,1995,32(4):591 - 598。
确认
国家自然科学基金(NSF/IOS-0923975)、长江学者奖、千人计划等项目资助。
作者信息
隶属关系
通讯作者
额外的信息
作者的贡献
CT对模型进行了推导并进行了计算机仿真和数据分析。BZ和MX收集了杨树杂种的数据。ZW和JS参与了模拟研究。XP参与模型设计和结果解释。MH构想了这个实验。RW开发了模型和算法,协同仿真和数据分析,并撰写了论文。所有作者都已阅读并批准了最终稿。
作者为图像提交的原始文件
以下是与作者的原始提交的图像的链接。
权利和权限
开放获取本文由BioMed Central Ltd授权发表。这是一篇开放获取的文章,是根据知识共享署名许可协议(https://creativecommons.org/licenses/by/2.0.)提供任何介质中的不受限制使用,分发和再现,所以提供了正确的工作。
关于这篇文章
引用这篇文章
佟聪,张斌,王志强。等等。交互式特征基因座的出媒体交叉与映射算法的多晶型背景模型。BMC植物杂志11,148(2011)。https://doi.org/10.1186/1471-2229-11-148
收到:
接受:
发表:
关键词
- 数量性状位点
- 联动组
- 定量特质基因座映射
- 上位性效应
- 数量性状位点位置