跳到主要内容

利用全基因组SNP数据重建苹果种质多代大系谱

抽象的

背景

苹果马鲁斯x有明显Borkh。)是温带地区最重要的果树作物之一,具有巨大的经济和文化价值。苹果品种可以通过嫁接来维持几个世纪以来的植物收藏品,有些人被认为是迄今为止作为罗马时代的回报。分子标记提供了一种重建百分点的方法,并因此在近期迁移和生物材料贸易历史上揭示闪光。本研究的目的是使用全基因组SNP数据(〜253 k SNP)来识别一组超过1400多种旧苹果品种的关系,以重建偶数。

结果

采用简单排除检验,在计算孟德尔错误数的基础上,鉴定出1000多个亲代关系和295个完整的亲代家庭。此外,在26对父母-子女配对中,有一对祖父母夫妇被确认为缺失的父母一方。在407个没有第二个父母的父母-子女关系中,327个可以被定向,因为其中一个个体是一个完整的家庭的后代,或者通过使用父母的历史数据或记录的日期。鉴定了“Ribston Pippin”、“White Transparent”和“Braeburn”等代表性品种的亲本。结合所有已确认的关系,整个系谱包含了7代,并揭示了两个文艺复兴时期的法国和英国品种的主要影响,即“Reinette Franche”和“Margil”,以及一个来自18世纪的东北欧洲品种,“亚历山大”。相反,一些来自中世纪或罗马时代的较老的品种,在一组研究的遗传材料中没有或只有一个可识别的后代。来自不同欧洲地区的品种之间的频繁杂交已被确认,特别是从19世纪开始。

结论

超过1400个苹果基因型的可用性,先前筛选的遗传独特性,并提供了广泛的欧洲种质的代表性,已成为成功的大型家系重建的工具。它对欧洲苹果品种的经验选择历史和近期育种具有启示意义,并为加快未来的育种和选择提供了思路。

背景

有关股份基的信息是各种用途的战略,来自动物和植物育种人类或野生动物遗传学研究。在繁殖中,血统知识对于估算经济上有趣的特征的遗传和遗传相关性是必不可少的[1].只有标记的虽然可以提供一些遗传参数的精确估计[2],谱系信息使得还可以考虑由于共享父母而导致的背景相似性[3.].

在野生动物遗传学中,当血统被人知道或推断时,可以估计生态相关性状的参数,最常与健身有关。在保护遗传学中,血统信息能够估计个人之间的相关性,并可以帮助遗传管理计划[45].此外,百分比可以告知交配行为和野生种群中生殖成功的变化。此外,血统知识对于在最近的时间尺度上追踪迁移或交流的历史,不仅适用于它们所传达的生物材料。最后,血统知识和准确性是有助于组装成分的平衡集,代表重要的育种父母,目的是使用基于谱系的分析方法来检测和验证QTL的目的[678].

当交配和/或亲代关系不可观察时,分子标记可用于重建种群的系谱,例如水生动物[9[还调查父母可能不确定的录制百分点[10.].相反,当同时获得大量标记数据时,利用已知系谱作为检验孟德尔遗传一致性的基础,有助于质量控制[11.].随后,Pedigrees可以为缺失的标记数据的归咎提供重要信息,特别是对于最近一代(S)[12.].

尝试使用分子标记进行测试或重建少数以20世纪80年代中的同工酶分析开始13.14.],继续采用小卫星指纹识别[15.16.17.[然后微卫星(SSR)标记[18.19.].最近,单核苷酸多态性(SNP)提供了前所未有的能力,该能力是由于它们的高丰度,Codominant的遗传模式和通过高通量基因分型技术进行基因分型的低成本来重建偶数的能力[10.20.2122].琼斯等人回顾了亲子关系分析的六种方法[23一切都被认为是有价值的。然而,正如作者强调的那样,一项成功的研究不仅仅依赖于数据分析的方法,还依赖于使用的标记的数量和质量以及足够的人群抽样。

苹果马鲁斯x有明显Borkh.)是一种非常重要的水果作物,全球年产量为8300万吨(FAOSTAT, 2017年),覆盖490万公顷,主要在温带地区。栽培的苹果被认为来自中亚的森林物种M. Sieversii.(LDB。)M. ROEM,随后来自欧洲Crabapple种类的后期遗传贡献M. Sylvestris.磨。[24].嫁接过程,可能是3800年前在美索不达米亚发展起来的[25[使得所选人的克隆繁殖,这些胞胎保留其遗传组合。因此,在他们从种子的起源后,可以在收集中保持栽培品种。

非常古老的品种,如“Pomme d’Api”(同义词“Api Rose”,“Lady Apple”)和“Court-Pendu”(“Capendu”)据说是罗马起源,尽管没有什么具体的证据[2627].罗马族裔普罗兰普罗尼亚州的24种苹果品种史学家的法则(引用Leroy [26])。像十三世纪一样回到“Costard”和'Costard''和'老Pearmain'这样的神话品种[2829,但似乎并没有保存在这些名字之下。后来,在16世纪和17世纪,一些品种的名称变得更加确定,如“Api”(派生为:“Petit Api”,“Gros Api”,“Api Etoilée”),“Reinette Franche”,“Calville Blanc d’hiver”,“Calville Rouge”,“Court-Pendu Gris”,“Golden Pippin”,“Rambour”,和“Petit- bon”(引用Leroy[引用]26])。从同一年龄来看,来自旧品种的苹果果实也是在绘画中代表的,例如,Bartolomeo Bimbi绘画在别墅Medumea di Poggio a Caiano,Prato,意大利。

接枝过程的另一个结果是,所选的个体很容易地传播和分布大。因此,当今的苹果制作和育种是由相对少量分布的品种的主导地位,可能导致遗传多样性降低[30.31].幸运的是,已经建立了许多种质收集,用于评估在区域或一个国家或一个国家生长的物质,和/或为未来几代人提供这种可变性。因此,全球收藏中的成千上万的苹果品种[323334].

已经用分子标记分析了许多种质收集,以确定冗余并确定遗传多样性和结构。然而,大多数研究已经处理了来自地理区域有限的材料[35363738394041424344454647].另外,使用不同的标记技术或不同的标记物,在全球层面上阻止了分析。只有最近,通过使用常见的SSR标记来扩大遗传多样性研究的范围[3248].

在一些上述研究中进行仔细分析,但标记数量不足,这些标记数量限制了推断养殖的能力,特别是在具有广泛发生的等位基因的基因型之间。因此,难以识别多一代后代数量后代的关键人物32].还发布了其他试验或收回象征品品种父母的尝试[20.3839495051.52.53.]但这些往往是基于一组有限的种质。最近,在基因分开了英国国家果实收集(超过2000种附加)的大型国际种质收集后,已经提出了额外的股份寡言(超过2000年),其中多样性阵列技术(DART)标记[54.],但这些标记的优势性质和群体内的混合水平限制了可能涉及潜在近交系或混合倍性关系的推断。

苹果品种的谱系重建可以在历史交易中阐明,例如,在农民之间的当地规模处或在各国内部和跨国公司之间的广泛规模更广泛地进行嫁接移植物。它还可以阐明苹果海外运动的光,其种子已经引起了许多所谓的“机会幼苗”[30.].

本研究的目的是在一个非常大的苹果品种组中调查亲本和重建系谱®Apple480K阵列[55.].支持大量SNPS使我们基于孟德尔误差计数使用简单的排除测试来识别众多父母后代关系,从而重建涉及在几个世纪中选择的品种的多代群。为了我们的知识,这是对常年果实物种进行的最大分析。

结果

Parent-offspring重奏曲

共有1425个二倍体个人(附加档案1:用公理分析表S1)®Apple480K阵列[55.].一组253 K的snp(附加文件2:使用PLINK的“PI_HAT”参数,使用表S2)通过血统(IBD)共享概率来计算所有可能的二倍体的分组概率[56.].对于具有大于0.4的PI_HAT值的3655个配对,孟德尔误差(ME)的分布范围为0至9376,具有600周围的不同间隙(图。1).Below this gap was a total of 1181 pairings deemed to be parent-offspring relations (duos), of which 184 pairings were from two small segregating populations, each containing 46 progenies and their parents (i.e. one for each of the two known parents with each of the 92 offspring). The number of ME varied between 767 and 1240 for 23 pairings of presumed full-sib individuals, either from the two segregating populations (20 pairs) or deduced retrospectively from further complete parent-offspring trio analysis (3 pairs). Other pairings of full-sib individuals from the two segregating populations presented higher ME counts. Four parent-offspring duos reported in the literature had a ME count above the threshold of 600: ‘Westland’ and ‘Heyer12’, with 1241 ME; F2–26829–2-2 and PRI14–126, with 1549 ME; ‘Rescue’ and ‘Norland’, with 1816 ME; and ‘Rescue’ and ‘Parkland’, with 2968 ME.

图1
图1

3655对二倍体中孟德尔误差(ME)的分布马吕斯有明显个体被测试为亲子二人组。推测出来的父母-子女配对在灰色的条形图中,完全同胞配对在粉色的条形图中,半同胞配对在浅蓝色的条形图中,其他配对在紫色的条形图中

涉及二人组的关系网

在被检测的1425个二倍体中,共有924个个体参与ME计数低于600的配对,这些个体被认为是亲代-子代组合;其中有92个后代来自这两个分离的种群。排除后者后,我们发现397人(30%)只参与了一个父母-子女双人组,307人(23%)参与了两个双人组,73人(5.5%)参与了3 - 5个双人组,31人(2.3%)参与了6 - 10个双人组,24人(1.8%)参与了10多个双人组,最大数量为66个亲子组合,涉及法国老品种“Reinette Franche”(指定了独特的基因型代码“MUNQ 278”;见附加文件1:表S1和方法,植物材料)。剩下的501(38%)二倍体个体没有参与任何配对。从所有提议的父片后代Duos获得的网络,如图2所示。2在我们的样本中,包括一个包含766人(58%)的大样本组,6个包含3到5个人的小样本组,以及23个只包含2个人的样本组。

图2
图2.

832个二倍体的系谱关系网络马吕斯有明显个人。每个个体用一个点来表示,而网络中的连接线则表示一级关系。除了“Reinette Franche”、“Cox ' s Orange Pippin”、“green point”、“Alexander”、“purple point”和“Borowitsky”、“Orange point”以外,所有个体都用蓝点表示

完成parent-offspring三人小组

共检测了13,603个潜在三倍体个体(1个个体及其2个潜在亲本),计数范围为0 ~ 31,398 ME。ME在所有被试三组中的分布(图。3.)包含大于575和3448之间的巨大差距,而且具有大于或等于3448的第一个三个具有大于或等于3448的三个Trios,所有人都建议了同一个人('Cox的橙色pippin')作为后代,因此并不是所有可信的。总共295个TRIOS在600以下的情况下,这些标准被推断为完整的父母后代集。其中,32个推断的父耦合在两个和五个后代之间共享,导致小全SIB系列,而212个推断的父耦合只有一个后代在数据集中。The largest inferred full-sib family included as the parents ‘Jonathan’ and ‘Cox’s Orange Pippin’ and comprised five offspring, namely ‘President Boudewijn’, ‘Prinses Beatrix’, ‘Prinses Irene’, ‘Prinses Marijke’ and ‘Céres’, the first four being documented to have been raised from these two parents in 1935 by ‘Instituut voor de Veredeling van Tuinbouwgewassen’ (IVT) in The Netherlands (28; Additional file3.:表S3)。'Jonathan'和'Cox's Orange Pippin'独立地,也是基因型,因为父母在最多的TRIOS中推断,分别为24和45个后代。将一百个另外的基因型推断为两种或更多种TRIOS中的父母,而73只被推断为仅在一个三重奏中被推断为父母。

图3
图3.

孟德尔误差(ME)在13,603个三倍体中的分布马吕斯有明显个人测试为完整的父母后代三重奏。推断的父子后代TRIOS在浅灰色杆中占据了浅灰色棒中,以及深灰色杆中的被拒绝的三角体

所有得分低于600 ME的三重奏在附加文件中显示3.:表S3。我们能够找到以前的历史文件(来源提到的附加文件4)关于TRIOS的父母和我们的调查结果的父母均达成协议,其中有79人一致。As an example, the documented parents of several famous cultivars such as ‘Gala’ (= ‘Kidd’s Orange Red’ x ‘Golden Delicious’), ‘Discovery’ (= ‘Worcester Pearmain’ x ‘Beauty of Bath’), ‘Fiesta’ (= ‘Cox’s Orange Pippin’ x ‘Idared’), ‘Fuji’ (= ‘Ralls Janet’ x ‘Delicious’) and ‘Akane’ (= ‘Jonathan’ x ‘Worcester Pearmain’) were all in agreement with our findings. For four trios, the documented name of at least one parent was not identical to the preferred name we chose for the individual identified, but was similar, and this is a complication broadly accepted within the international genetic resource and horticultural community. For example, ‘Zhigulevskoe’ is documented as ‘Duchess of Oldenburg’ x ‘Wagenar Prizovoe’ (Additional file3.:表S3)和我们的结果确定了“Wagener”X'Borowitsky'作为潜在的父母;'borowitsky'是“奥尔登堡公爵夫人”的同义词,我们认为“瓦格纳省掌上”(意思是俄罗斯奖的奖品)最有可能引用“Wagener”。对于119中的15个TRIOS,只有一个被文件的父母与我们的调查结果同意,而11 TRIOS则没有记录的父母同意我们的结果。最后,对于10个TRIOS,不同的来源表示不同的父母,我们的发现只与其中一个可用来源一致。

我们只能找到23个确定的三人中的一个父母的文件(附加文件)3.:表S3)。记录在案的家长同意其中的12项;对于另外三个三人组,记录在案的父母的名字与一个确定的父母的名字相似。然而,在八个三人组中,记录在案的父母不在确认的父母之列。

我们还检查了这三首歌的时间一致性。我们发现了192个三元组的推断父母和后代的记录日期(附加文件3.:表S3)。推断后代在180例案件中表现出比其拟议的父母年轻。我们发现只有7个其他三人的推断父母中的一个被记录的日期,并且推断后代比在所有情况下的推断父母更年轻。在日期似乎可能不一致的十二个案例中,记录的日期是首次录制或收集中的接收的日期,这可能与真正的发起日期相比,因此不要能够评估时间转移时间。

面向parent-offspring重奏曲

在去除亲代-子代组合后,这些组合随后被识别出在三个一组和那些被分离的种群中,共有407个推测的亲代-子代组合保留了下来。在其中的71个个体中,有一个个体已经被认为是三个个体中的潜在后代,因此被推断为其余两个个体中的潜在亲本。对于另外6个二人组,其中一个个体被确定为这些新定向二人组的后代,因此推断为其余二人组的亲本。所有77个父母-子女组合都出现在附加文件中5:表S4。剩下的330个二人组在这个阶段无法确定方向。

总体而言,22种基因型被推断为父母在导向二人中,其中12人被推断为两个或多个导向二级的父母,因此建议相应后代之间的半SIB关系。有趣的是,两种基因型被推断为十多个定向二人的父母,即'Reinette de Hollande'和'Calville Rouge d'塞子',分别为19和11分别推断出后代。

330个非定向双基因涉及415个基因型,其中75个基因型涉及两个或更多的双基因型。值得注意的是,三种基因型“Reinette Franche”、“White Astrachan”和“Saint Germain”分别被推断为57、12和10个亲子关系,以及被推断为9、4和6个三胞胎的父母。

我们发现关于25个被推断为定向二人组后代的个体的父母一方或双方的文件,我们的发现同意其中15个父母中的一个(附加文件)5:表S4)。其他父母要么从我们的数据集中缺席(对于“tallounette”和'delrouval')或被视为为false(例如,'bismarck')。我们发现记录的日期,即49定向二人组的推断后期和父母,其中38个是按时间顺序一致的。同样,大多数例外情况涉及首次录制或收集中的接收的日期,这可能与真实的发起日期相比。

所有330个非定向二重奏都在附加文件中6:表S5。我们发现这些父母在这些二人组中的82名中的一个人的文件,并且这种关系在44个案件中与我们的调查结果一致,允许我们定向这对。我们发现有218名非导向二级和202人的两名成员的记录日期,一个成员明显比另一个成员更近期,因此被视为可能的后代。对于其中的41个,日期支持已从文档的父母中推断出的方向。对于一个DUO,根据记录的父母定向,然而,记录的日期矛盾,即“FENOUILLET RUGE”推断为“OPETIAN”的后代。对于161个DUOS,记录的日期是唯一的依据来定位二重奏。Two individuals, namely ‘Míšeň jaroměřská červená’ and ‘Pine Apple Russet’, were each inferred as offspring in two duos based on dates, although this was in contradiction with the fact that the two proposed parents and the related individual did not form a trio.

In 15 cases, the documented dates were too imprecise or too close to determine orientation, including two duos involving ‘Opetian’, with ‘Pacheroux’ and ‘Pomme de Sore’, and two duos involving ‘Reinette Franche’, with ‘Calville Malingre’ and ‘Nonpareil’. Another 45 duos were oriented because one of the individuals was the offspring in a duo oriented thanks to previously documented parentage or date. However, dates contradicted the orientation for two of these, ‘Golden Dorsett’ as an offspring of ‘Anna’ and ‘Belle Fille de l’Indre’ as an offspring of ‘Franc Roseau du Valais’. Finally, the 80 remaining duos could not be oriented.

祖父母 - 父母后代群体

使用25 K单核苷酸多态性的第一子集,ME在所有测试组中与潜在祖父母夫妇、亲本和后代的分布都显示出10和35之间的明显差距(图5)。4).在初始自由派选择与我少于或等于100时,使用在潜在祖父母的潜在祖父母 - 父子后代组的测试子集中设置的253 k SNP的分布包含在85和312之间的间隙(图。5).前8个ME计数大于或等于312的组都表明与后代具有相同的基因型(“Cox’s Orange Pippin”),因此,也不是所有组都是可信的。总共有26组代谢能低于100,在谱系分析中进一步考虑(附加文件)7:表S6)。两对可能的祖父母夫妇有超过一个推测的孙辈,而19对只有一个推测的孙辈。此外,在数据集中,这些潜在的祖父母夫妇中有四人也有一个或两个推断出的后代(即在推断出的三人组中被确定为父母夫妇)。共有36个基因型被推断至少一次作为祖父母,其中8个被包括在2到5组。在预测的六组中,潜在的父母-后代的取向已经被解决,因为父母也被推断为三个孩子中的一个。在一个推断的祖父母-父母-子女组中,将“奥尔良”确定为潜在后代支持了一个二人组的先验取向,其中“安娜”被认为是后代,而“奥尔良”是基于记录的日期(附加文件)6:表S5)。

图4
图4.

孟德尔误差(ME)在1823127个二倍体群体中的分布马吕斯有明显个人被视为祖父母 - 具有25,310个SNP的父母后代组。进一步调查的组在浅灰色条中占据了浅灰色条,并在深灰色杆中的被拒绝的组

图5
图5.

孟德尔错误(ME)的分布计数273组二倍体马吕斯有明显个体作为祖父母-父母-后代群体测试,有253,095个snp。接受的组用浅灰色条表示,拒绝的组用深灰色条表示

所有推断出来的祖父母-父母-子女组都在附加文件中7:表S6。在这些组中发现了15个被推断为后代的品种的亲本记录,其中6个品种与我们的结果一致。我们发现在潜在的祖父母-父母-后代群体中有22个个体被推断为后代,这些数据与所提出的取向一致。有趣的是,五个推测出来的后代来自同一对潜在的祖父母夫妇,即“Keswick Codlin”x“Hawthornden”。

谱系从所有结果推导出来

所有推断的三人,导向二人和祖父母和父母后代的群体都用于生产一个包含775个基因型的大型血统,其中包括133名创始人,295个基因型,两种推断父母,295个基因型,只有一个推断的父母,26种基因型一个推断父母,一个丢失的父母和推断祖父母和来自祖父母的父母后代组的相应26个失踪的父母。由于非线性二重奏未包含在本血统中,因此在此考虑的某些人作为创始人均为另外相关的,例如,“加强佛罗里尔”和“非巴里尔”。

推导的血统包括七代(图。6;附加文件8;附加文件9图S1),两位创始人瑞奈特·德·圣东日(Reinette de Saintonge)和格莱姆斯·戈尔登(Grimes Golden)是最古老的祖先,因此也是第一代。推测这两个品种在系谱的第二至第七代分别有244个和38个后代。所有推测出来的“Reinette de Saintonge”的后代都是通过“Reinette Franche”派生出来的,其中很大一部分(244个中的77个)是通过“Reinette de Hollande”产生的“Reinette Franche”和“Reinette des Carmes”之间的交叉。相比之下,在被探索的数据集中,“莱尼特·德·奥朗德”的两个完全兄弟姐妹(“马伯特的皮尔斯曼”和“亚当斯的皮尔斯曼”)没有任何预测的后代。创始人“亚历山大”推测了四代以上的后代,总共预测了105个后代。另一位创始人有无数的后裔(87)超过四代是' Margil ',主要通过' Cox '的Orange Pippin '被推断为其第一代后代。相反,“黑花雀”在四代中只有四个后代,即每一代一个。

图6
图6.

重构的《胡德的至尊》谱系。品种名称的简短版本(见附加文件)1:表S1)。名称条的颜色表示系谱中个体已知的信息水平:蓝色表示双亲已知的个体,奶油色表示双亲已知的个体,深绿色表示创建者。关系用黑线表示,因为我们的数据无法识别母亲和父亲。图是使用从附加文件中提取的数据绘制的8和Pedimap软件[57.

推导出近亲繁殖

根据推测的血统,发现有7种基因型是由他们推断的两个父母的共同祖先近亲繁殖的,即“乔治·卡朋特”(通过“雷内特·德·奥朗德”)、“阿尔罗”、“小皮平”和“F_Democrat”(通过“雷内特·弗朗切”)、“仙女女王”和“胡德的最高”(通过“考克斯的橙色皮平”)。以及F_Rosavril(通过Winesap)。考虑到295个完整的亲本-子代组和26个祖父母-亲本-子代组,基于系谱的自交系基因型出现的频率为2.2%。当将这种近交系评估与所有二倍体基因型的杂合度进行比较时,我们发现杂合度在0.24到0.397之间,只有3个个体被认为是具有统计学意义的异常值(P< 0.05)与所有基因型杂合度分布的比较(见附加文件10.:图S2)。这3个异常基因型分别为‘Maiolino (PA)’、‘Hashabi (MH. 10-1)’和‘Fairie Queen’,杂合度分别为0.240、0.244和0.248。

三倍体

八个三倍体品种与公理进行基因分型®Apple480K数组,并分析,如果他们是二倍体(见方法)。所有被测三倍体-二倍体个体中ME的分布都有一个明显的差异,约为300(附加文件)11.:图S3)。使用此作为阈值导致总共66个潜在的三倍体后代 - 二倍体母体对。对于这些成对的所有66,三倍/二 - HET SNP的数量(三倍体后代的纯合酶和二倍体母体SNP中的杂合)在593和38,461之间变化,间隙约为1200.五次推断三倍体后代 - 二倍体父对的计数在1200以下的Tri-HOM / DI-HET SNP的计数,这被视为阈值,以指示可能贡献二倍体配子的潜在父母。

共检测了515个潜在的三倍体后代和2个二倍体个体作为亲本,计数为136 ~ 29574 ME。ME在这三个被试群体中的分布在246和5170之间有较大的差距。有两个推测出来的三人组的ME值低于300,分别是' Jonagold ' = ' Golden Delicious ' x ' Jonathan '和' Ribston Pippin ' = ' Margil ' x ' Nonsuch Park '。由于后代是通过现代植物育种派生出来的,第一个推断出来的三胞胎已经有了很好的记录,而第二个只是Ordidge等人提出的部分。[54.他最近推断出了“Margil”和“Ribston Pippin”之间的二人组合。

在61个二倍体个体中,具有低ME计数的可能与三倍体亲代亲缘关系,但与三倍体亲代亲代亲缘关系较多的有56个个体与三倍体亲代亲代亲缘关系n三倍体的-配子亲本,当一个被鉴定。其中,“Cox’s Orange Pippin”被推断为“Margil”的后代(补充文件)6:表S5),显然2n- 基于记录日期的“Ribston Pippin”的父母父母。对于所有这56个二倍体个人,我们还检查了他们几乎从未在2时从单倍体配子父母获得等位基因n- 三倍体的父母的三倍体是纯合的,三倍体杂合。表明来自单倍体配体父母父母的推定等位基因传播的SNP的最大计数为18.因此,我们可以将三倍体排除为这56个二倍体个人的父母,并自信地考虑他们与推断2的父母后代关系n- 父母。对于具有较数少量的三个推断的三倍体 - 二倍体配对和大量的三磡/偶像SNP,我们无法识别2n- 营业父母,因此我们提出了二倍体,因为潜在的父母为三倍体贡献单倍体配子。然而,它们可以替代地与未知2的父母后代关系n-配子亲本使它们成为三倍体的兄弟姐妹。其余两对推测的三倍体-二倍体配对具有低数量的ME和大量的三倍/二倍snp,作为二倍体,在推测的两个三倍体中贡献单倍体配子的个体。这些结果显示在附加文件中12.: S7表。

讨论

在本研究中,我们利用了Axiom可获得的密集SNP数据集®苹果480k序列用于苹果品种亲缘关系的研究和系谱重建。我们使用了一个简单的排除测试,基于计算假定关系中的孟德尔误差(ME)。对完整的亲子三组和个体亲子二组进行了调查。在只有一个单亲的情况下,我们调查了失踪父母的父母是否可以通过额外的祖父母-子女关系来确定。

检测二重奏和三重奏的方法学

考虑到大量可用的单核苷酸多态性和被放置在阵列上的标记覆盖的小等位基因频率(MAF)范围广泛[55.]我们认为,基于ME计数的简单排除测试足以支持我们的调查结果,并且这允许我们避免更多数学上复杂的方法,这可能需要无差错数据,并且由跨越几代的关系泄压。苹果中的情况如同。

在253,095个SNP(0.24%)中的误差阈值是根据在测试的配对上识别我分布的明显差距选择。从理论上讲,预期任何真正的父母后代关系都会完全没有我,这可能是剩余实验误差和/或生物变异的指示。

有趣的是,引起ME的SNPs主要集中在一条或两条染色体上,而最接近600 ME阈值的是H 31-31 - Baujade染色体,220个ME中有191个发生在9号染色体上;对于“Worcester Pearmain”和“Sjögesta Pippin”-“Grågylling”这三个组合,超过69%的ME(从282到559)发生在13号染色体上;而在417个ME中,为二人组合“HYB”的130和227个ME。N°29 ' - ' Prima '分别位于第1和第5染色体上。这一浓度的ME可能与从野生和/或相关的染色体片段相对应马鲁斯在这些物种中,序列的差异可能会产生更高频率的无效等位基因或错误等位基因。在我们的阈值之上,我们确定了四对已经被记录为亲本后代但ME含量相对较高的配对(1241-2968):其中一对已知来自野生物种马吕斯多花植物(“f2 - 26829 - 2 - 2”和“pri14 - 126”);其余的品种包括在加拿大农业现代研究站培育的抗冻品种,那里有使用野生物种和“山楂”的记录历史,所有这三个品种都有一个亲本,“Rescue”或“Heyer12”,被列为一个杂交品种[58.].在所有四种情况下,高数量的ME都可能来自带有空等位基因的snp。总的来说,我们认为600 ME的阈值是足够稳健的,虽然它可能排除一些具有杂交背景的苹果,但我们预计I型风险(接受错误的父母-后代)和II型风险(丢失真实的父母-后代)是低的。

对于潜在的完整的亲子三组,ME值(< 600)以下的组和ME值以上的组之间的差异要比双组大得多,说明该参数引入了进一步的区分水平。这与将后代的所有等位基因分配给三个亲本中的任何一个的要求是一致的。同样,基因分型错误和无等位基因可以解释在完全不存在ME的三人组中发生ME的原因。

高于门槛,9个第一三人(与我在3448到5008的范围内)包括6个案件,其中'Cox的Orange Pippin'是拟议的后代。显然,'Cox's Orange Pippin'不能成为6种不同父母的产品。然而,6中的五个将参与“Margil”作为第一个父母,并作为第二家父母的“Cox的橙色皮皮”的记录或目前推断后代(因此,根据我们的解释是祖父母 - 父母后代群体);第六次涉及“Cox橙皮”的两个后代之间的配对,其中一个是与后交与“Cox的橙皮”衍生的作为复发父母。确实在这里推断出“Cox的橙色皮皮”是父母和(经常性的)祖父母的“童话女王”,而“詹姆斯哀悼”被推断为其其他父母(附加档案3.:表S3)。In the remaining three cases, 1-‘James Grieve’ was rejected (4242 ME) as a potential offspring from ‘Potts’ Seedling’ and ‘Fairie Queen’ whereas a more probable prediction (with only 28 ME) suggested that it is an offspring from ‘Potts’ Seedling’ and ‘Cox’s Orange Pippin’ in agreement with Ordidge et al. [54.2-‘Jonathan’作为‘Montfort’和‘Florina’的潜在后代被拒绝(4979 ME),两者都被推断或已知(分别)为‘Jonathan’的后代,3-“Reinette Franche”被拒绝(4843 ME)作为“Clemens”和“Reinette de Breda Grise”的潜在后代,因为两者都被推断为“Reinette Franche”本身的记录日期。在所有这9个案例中,ME的适度值可以解释为正确的直接关系的定向错误,以及可能发生的近亲繁殖。这进一步凸显了部分驯化苹果种群的复杂性。总而言之,600 ME的阈值再次被认为是非常稳健和严格的。

最后,对于潜在的祖父母 - 父母后代组,大约100 ME的间隙似乎构成了坚固的推断阈值。实际上,两个最不支持的案件与85或63我再次涉及来自野生物种的已知队群成员马吕斯多花植物(‘F2-26829-2-2’和‘PRI14-126’),推测会产生空等位基因。另一边的门槛,所有6例和我从312年到416年由团体与考克斯的橘子皮聘一个“Margil”或“温斯顿”的后代,配对的“考克斯的橙色皮平的记录或推断的后代(“与仙灵女王”,“王子比阿特丽克斯”,“嘉年华”…)作为祖父母,这是不可能的。

选择MUNQ的首选名称

本研究推断的亲缘关系是基于欧洲种质资源中保存的基因型。因此,我们的研究结果的历史和世袭价值将依赖于首选品种名称对MUNQ基因型的充分归属(见方法)。我们知道,许多著名品种的同义词都是已知的,并有文献记载,如' Borowitzky ' = ' Charlamowsky ' = ' Duchess of Oldenburg ',或' Dutch Mignonne ' = ' Reinette de Caux ',另外的假设同义词最近已经通过在众多种质收集(例如[32])。过去,在种质资源收集中经常发现错误的入刊名称[51.].然而,在本研究中,我们专注于良好的策划收集,并考虑了我们对首选名称的归属中的所有可用基因型和护照信息。这项工作可能会在未来发展新的基因型,护照和杂志数据,毫无疑问,可能会提出进一步的问题,就某些摘要的特鲁斯到型。例如,我们发现从NFC收集(Munq 1973)中推断出加入1948-737的父母,名为“Topaz”,并不对应于该品种的记录的血统。由于SSR基因分型(未显示数据),还发现加入与其他同名(Munq 1213)的加入不同。彻底审查收集记录显示,“黄玉”是一种历史上至少两种不同品种的同声义。因此,添加到名称的原点的指示将使两者之间更容易区分。尽管如此,我们考虑本研究中的父母分配,对有问题的遗传物质以及大多数众所周知和良好记录的品种的大多数作出稳健。

抽样偏差的可能影响

任何父母分析的力量取决于所研究的基因型组的尺寸和完整性[23:从逻辑上讲,越大越好。如果研究样本中缺少一个特定的父母或祖父母,系谱重建将受到阻碍,代或连接的数量将受到限制,特别是当个体在整个系谱中发挥关键作用时。在我们的研究中,我们从1400多个不同基因型的大样本开始。基于已有的SSR基因分型和分析[32],优化SNP基因分型个体的选择,以避免冗余,并涵盖大多数欧洲甜点苹果品种的广泛遗传多样性。使用可用的SSR数据,选择了额外的换乘,可能在Apple Pedige中有影响力。这是“加强佛罗里尔”和“Calville Rouge”在SSR等位基因共享的密切审查后确定的情况,突出了INRA系列中各自的等位基因的高频(J.L.Crépin,个人沟通)。常年和克隆繁殖的物种像苹果这样的巨大繁荣的一个很大的优势是古代品种的可用性,有些是几个世纪的老年人。这是多代谱系重建的主要和非常有利的点[18.].

尽管如此,在我们1400多个基因型的样本中,欧洲品种的代表性仍然有些不平衡,因为各种实际和组织的原因。尽管后来添加了一些品种,以改善非常古老的或欧洲范围内甚至美国种质的代表性,基因分型的最初目的是利用来自几个地点的表型数据进行GWAS。因此,取样偏向于来自法国、比利时、英国、瑞典、意大利和捷克共和国的品种。整体系谱的重要创始人或成员几乎肯定被忽视了,因为缺乏例如关键的德国或西班牙品种。相反,来自英国和法国的品种的巨大连接网络可能是由这些国家的强大代表性推动的。进一步的分析可能会揭示其他地区的类似网络。

作为一种绕过血统建设中失踪父母的一种方式,我们试图将祖父母推断为预测的父母后代Duos中失踪父母的替代品。这种方法证明是成功的,尽管只有一个相当有限的情况(附加文件7:表S6)。然而,通过反复鉴定两名共同指定的祖父母,即5推断后代,即'keswick码头'和'霍瓦斯顿',这是一个有趣的案例。作为't的推断祖父母。Wright','Carlisle Codlin(大量)','Cutler Grieve','Grimoldby Golden','牧师W. Wilks'。

推断的谱系与记录的日期和父母的一致性

推断的系谱的很大比例是一致的日期和父母在各种各样的pomological书籍和来源(附加文件4).这进一步支持了我们对该技术的使用,并进一步增强了研究结果的稳健性。不一致可能会因为不准确的文档或不准确的pomological identification而产生,并且如上所述,根据我们的发现,一些首选的名称可能会受到质疑。

在许多情况下,我们的研究结果与以前发表过的标记的血统推断是高度一致的,例如:涉及“Geheimrat Doktor Oldenburg'和'Cox的Orange Pippin'的三人组作为”Dukat“的父母[51.];为“grumes golden”和'golden delicious'的父母后代二重奏[52.];“Dülmener Rosenapfel”的父母是“Dutch Mignonne”和“White Astrachan”(与“Petite Madeleine”同义)。39];“Abbondanza”和“Decio”三人组是“Scodellino”的父母[32];“考克斯的橘皮平”和“考克斯的波莫娜”饰演“英格丽德玛丽”的父母。38]以及涉及'Cox's Orange Pippin'和'Cellini'的TRIOS作为'Laxton's Pearmain'和'Ellison's Orange'的父母[54.].我们还证实,对“Ribston Pippin”是“Cox的庞莫纳的父母”的广泛持有信念[27[最近由Larsen等人表现出了假。[38而且,重要的是,我们补充说,它似乎也不是“考克斯的橘子皮平”的父母。

一些不一致的不一致性也值得突出,例如“莱克斯顿的一流”和“莱克斯顿的珠宝”,这两个都普遍记录为“Wyken Pippin”X'Cox的橙色pippin'(或互惠交叉)[27在这里被推断为是“Cox ' s Orange Pippin”和“Cellini”的混合体。最近,Ordidge等人也做了同样的观察[54.]为'Laxton的Pearmain'。This could be due to an erroneous identification of the tree originally used as a parent by Laxton Bros. Another example is ‘Geheimrat Doktor Oldenburg’, found here to derive from the cross ‘Alexander’ x ‘Ananas Reinette’, which is inconsistent with previous findings of ‘Bauman Reinette’ being one of the parents according to SSR [51.].这个问题可以在获得后一项研究中考虑的树的DNA样本时得到解决。

获得结果的历史和遗产价值

“Reinette Franche”基因组的广泛传播:我们分析中最高度连接的品种是“加强佛罗里尔”,父母后代二零。'Reinette Franche'还为多代后代的最高分,总共243分,这意味着18%的学习基因型与“加固佛罗里尔”有关。其中许多人从其第一代Offspring'Reinette de Hollande'散发出来(同义词'Reinettecarminéede hollande'; [26),与“Reinette des Carmes”杂交而得。因此,尽管在欧洲有非常多的品种,' Reinette Franche '基因组的组成部分出现在推断的所有系谱中。然而,考虑到古老的形态学文献,这个结果并非完全出乎意料。著名的法国果树学家A. Leroy [26]在1873年写道,“Reinette Franche”是“相当数量的苹果品种的母亲”,引用了Charles Estienne [59.他描述了“Pommes de Renette”(一个同义词),表明这个品种可能在1540年就已经有30年的历史了,起源于法国西北部的诺曼底,在那里广泛传播;Reinette Franche的另一个同义词是Reinette de Normandie [60.].leroy [26]还引用了德国博物学家J. Mayer的说法,他在一个世纪前指出,“特许”一词指的是法国,这个品种是许多法国“Reinette”品种的起源[61.].‘Reinette Franche’ appears to have given rise not only to numerous French cultivars, but also to many well-known cultivars in other countries such as ‘King of the Pippins’ or ‘Peasgood’s Nonsuch’ in United Kingdom, ‘Rose de Berne’ and ‘Rose d’Ajoie Blaser’ in Switzerland, ‘Mela del Sangue’ and ‘Mela del Giappone’ in Italy, ‘Président Roulin’ and ‘Grosse Reinette Transparente Lebeau’ in Belgium, ‘Jonathan’ (through ‘Esopus Spitzenburg’) and ‘Melrose’ in the United States, and ‘Democrat’ (through ‘Reinette de Hollande’ as one of the two grandparents of its missing parent) in Australia.

欧洲的其他主要创始人:“Reinette des Carmes”(与“Reinette Rousse”同义)被认为起源于17世纪的法国[26]和stands out as a major founder for European cultivars through its role as the other parent of ‘Reinette de Hollande’ (together with ‘Reinette Franche’), and resulting links to numerous offspring spanning the fourth to seventh generations in the pedigree founded by ‘Reinette de Saintonge’.

“Margil”形成了另一个非常大的多代血统的基础,特别是通过推断它的第一代后代“Cox’s Orange Pippin”。' Margil '(同义词' Reinette Musquée ',也称为' Muscadet ')由A. Leroy提到[26]作为一个非常古老的品种(由Olivier de Serres的1608年描述)源自Normandie,它经常用于苹果酒或苹果酒。被认为在十八世纪中叶的Brompton Park(英国伦敦伦敦伦敦托儿所广泛传播[60.因此,他可能是《考克斯的橘子皮平》的母亲。“考克斯的橘子皮平”是由理查德考克斯于1825年在英国白金汉郡Slough的Colnbrook Lawn提出的[27]被推断为50个第一代后代的父母,包括来自英国的大量品种,例如“詹姆斯哀悼”和“莱顿的一流”。

俄罗斯品种'亚历山大'(同义词'aport'或'aporta'; [2627])被确定为另一位主要创始人,在5代的全球血统中产生超过100个后代。It originated in the late eighteenth century in the region of Moscow, and gave rise to numerous famous cultivars, such as ‘Cellini’, ‘Cox Pomona’ and ‘Peasgood’s Nonsuch’ in UK, ‘Reinette de Landsberg’ in Germany, ‘Signe Tillisch’ in Denmark, ‘Bismarck’ and ‘Democrat’ in Australia, and ‘Wolf River’ in Wisconsin, USA. The latter cultivar being an example of the influence from intentional introduction of Russian cultivars for use in the upper US Great Plains, as discussed by Volk and Henk [62.]和gross等人。[63.].

披露象征性品种的父母:披露“Ribston Pippin”的完整父母,来自英国最着名的品种之一,是本研究的另一个主要产出。据报道,“Ribston Pippin”是从Rouen(诺曼底,法国)的种子中获得的,该树在1690年左右,它在1815年在Ribston Hall,Yorkshire,英国约克郡(中国)[2627].它在19世纪的英国和国外广泛传播,在1800年代[26].它被发现是三倍体[64.]在这里,我们展示其父母是'Margil',这是一个贡献了一个2 n- 达到与ARMIDGE等人协议。[54.]和'nonsuch park'。'Margil'于十七世纪初文件记录,而“Nonsuch Park”仅被记录为“1831”中描述的[27].这将建议在首次描述之日之前,品种可能已经存在了一段时间,假设登录名是正确的。有趣的是,'Nonsuch Park'也被推断为'Reinette Franche'的第一代后代,因此早期的原产地将是合理的。“Ribston Pippin”也被陈述或据报道是至少16种品种的父母[27].在我们的样本中包括7个品种,我们推断其中2个品种都是亲本,另外5个品种都是亲本。然而,Ribston Pippin从未出现在被确认的父母中。

另一个有趣的披露是众所周知的品种“白透明”的父母(同义词'Papirovka','Klarapfel','Klarapfel','Pomme de Revel'...)来自波罗的海状态,并于1800年代中期进行了[27,推断出父母是“Aspa”和“St Germain”。有趣的是,“Aspa”是迄今为止保存在瑞典克里斯蒂安斯塔德Balsgård网站上的唯一基因型。除了“白色透明”,“Aspa”被推断为只有一个品种的父母,即来自英国的“河流”早桃。因此,尽管“白色透明”的成功,这种被认为是瑞典本地品种的贡献似乎是有限的。相反,' St Germain '(可能与' Virginischer Rosenapfel '同义),[27])was inferred as the parent of 14 other cultivars, nine of which originate from Sweden, including ‘Spässerud’, ‘Åkerö’, ‘Vitgylling’, and ‘Sandbergs Röda’, with the latter three inferred as full-sibs with the Swedish ‘Grågylling’ as the other parent. The contribution of ‘White Transparent’ to cultivar development through its 16 first- or second-generation offspring is therefore most likely due to favorable alleles inherited from ‘St Germain’ rather than from ‘Aspa’.

着名的新西兰品种“Braeburn”最初被发现为幼苗,长期以来一直被假设是基于RFLP和RAPD标记评估的遗传距离的“Lady Hamilton”的后代[65.].在我们的研究中,‘Delicious’和‘Sturmer’s Pippin’被推断为它的父母。“汉密尔顿夫人”不是480 K序列的基因型,但SSR数据表明,它很可能来自同一个杂交(16个SSR中没有ME;数据未显示),这将使它成为' Braeburn '的完全同胞。

相对较少的品种可以在地中海或亚热带气候的温暖地区成功种植(以色列、南非和美国的佛罗里达,…),因为大多数品种需要在冬季延长暴露在寒冷的温度下,以便花蕾和开花均匀地发生[66.].少数品种可以统称为低冷要求(LCR)品种包括' Anna '和' Golden Dorsett '。在这里,我们推断‘Golden Dorsett’是‘Anna’和一个未知的亲本的后代,它本身来自‘Douce de Sfax’,一个突尼斯品种可能已经被选择为LCR,和‘Golden Delicious’之间的杂交。这可以解释Trainin等人鉴定的lcr相关单倍型的纯合性[66.].

几个世纪以来Apple选择的历史校对:探索来自欧洲和国外的大量著名和鲜为人知的老苹果品种的系谱关系,为研究几个世纪以来的选择过程提供了一个独特的机会。主要和次要的历史事件,如战争、人类迁移或社会进化,可能引发了植物物质的短程或长距离交换,而苹果的多年生特性放大了这种特性,使得无性系嫁接木材和种子的运输得以进行。研究结果揭示了苹果选择育种的四个主要特征:首先,推断的创始者和后续品种对整个系谱的贡献高度不平衡;其次,在整个系谱的大多数部分中,检测到的代数相当低,类似于葡萄[18.];第三,尽管“Reinette Franche”和“Margil”的影响很大,但在系谱中可检测到的品种近亲繁殖的频率极低(2.3%);第四,杂交经常发生在欧洲不同地区的品种之间,这符合在欧洲水平上发现的弱遗传结构和突出的基因流[32].这些要点将在附加文件中进一步讨论13.

此外,在推断父母和后代的品种名称之间经常观察到相似性:例如,从'Reinette Franche'下降的品种九个品种有“加强”这个词。对父母及其后代的相同名称的归属最可能被从一代到下一个一代传递引人注目的杂色性状。

最后,对整个血统具有显着贡献的品种可以有助于选择祖先在现代育种计划中进一步交叉。可以考虑'Reinette Franche','Margil'和'Alexander'以用于此类目的。而且,在例如时段之间的十字架。'Reinette Franche'和'亚历山大'或'Margil'和'Red Astrachan'应该允许许多非常常见的QTL的遗传映射用于进一步的标记辅助育种目的。或者,在血统中的额定额度但被推断为其他着名品种的父母的品种也可以考虑选择这种着名品种的全面SIB,或者只是增加当前育种人群中的替代等位基因的频率。

结论

推测一个苹果品种的亲本需要大量的参考基因型样本,有效的分子标记和适当的分析结果数据的方法。在目前的研究中,1400多个苹果基因型的可用性,此前筛选的遗传独特性,并提供了广泛的欧洲种质代表,有助于系谱推断的成功。应该进行更大规模的分析,以进一步破译欧洲、北美、南半球温带国家和中亚-东亚公共和非公共收藏中保存的品种之间的遗传关系。高连接品种的鉴定可以帮助未来的全基因组测序策略,其中对网络创建者数量减少的深度测序可以帮助将基因型输入到基因型密度较低的剩余个体中。

我们应用的简单排除测试被证明是直接和高效的作为推断关系的第一种方法。在未来,更详细的方法,如计算单倍型共享[67.当中间基因型在种质收集中明确丢失时,应该有助于扩大系谱重建。这些方法可能有助于解决来自罗马时代和文艺复兴时期的古老品种之间的明显差距,这将阐明苹果在人类历史中的象征地位,一个前所未有的和迷人的历史联系。

方法

植物材料

本研究使用了1425个二倍体基因型(附加文件)1:表S1),各自给出了一个独特的基因型代码(Munq,对于Malus独特的基因型代码),作为FBUNQ代码(Forferbrefomics唯一代码)的开发,由Urrestarazu等人描述。[32基于SSR数据。这组数据在很大程度上复制了Urrestarazu等人为关联研究建立的研究小组[68.此外,还从英国国家水果收藏中心(NFC,英国)、意大利莱姆堡研究中心(Laimburg Research Center,意大利)和法国植物资源研究所(INRA,法国)的玫瑰花木生物资源中心(Biological Resources Center RosePom)收集了近160份种质。两个小的分离群体,每个包含46个后代及其亲本(‘Golden Delicious’(MUNQ 65) x‘Renetta Grigia di Torriana’(MUNQ 435)和‘Fuji’(MUNQ 318) x‘Pinova’(MUNQ 651))也被包括在内。此外,还包括8个三倍体基因型(附加文件)1:表S1)。

对于附加文件中的每个基因型1:表S1,一个“首选”名称是根据已记录的同义词、收藏列表、网站和参考书目,以及Urrestarazu等人所描述的关于匹配条目(“副本”)的信息。[32].历史数据的起源日期,第一次描述,介绍,记录或列入品种的收集,以及任何预先假定的亲本的文献都是从附加文件中提到的来源收集的4并在附加文件中指示1S1:表。为简单起见,这些信息分别被进一步被称为“记录日期”或“记录的父母”。Fernandez-Fernandez获得的SSR数据[69., Lassois等人[39和Urrestarazu等人[32]被用来分配所加入的Munq,这些论文中最初表明的名称有时被本研究中的“首选”名称取代。在我们的解释中,我们主要是指使用他们的首选名称的基因型,并且根据附加文件,这些优选名称直接对应于MUNQ1S1:表。

SNP基因分型

用公理分析所有基因型®苹果480k序列包含487,249个SNPs均匀分布在17条苹果染色体上[55.].先前选择的275,223个强大的SNP,由Bianco等人选择。[55.]最初用于分析。在父子后代分析的第一步(下面描述)后,从基因分型数据中进一步删除了22,128个SNP,显示了两个或多个接受的关系中的孟德尔错误,总共剩下253,095个SNP进行进一步分析(附加文件2:表S2)。为祖父母搜索选择了这些SNP的随机组25,310(即10%)(再次如下所述)。SNP位置基于苹果基因组的最新版本(V1.1),基于加倍的单倍体GDDH13([70];也可以看看https://iris.angers.inra.fr/gddh13/对于基因组浏览器)。

父级后代关系

使用PLINK分析所有可能的二倍体的配对(https://www.cog-genomics.org/plink/1.9/56.),使用“PI_HAT”参数计算身份下降(IBD)共享概率。一度相关性的期望值为0.5。在估计孟德尔误差(ME)数量之前,我们选择了3655对PI_HAT值大于0.4的配对,假设两个个体分别为亲本和后代:例如,如果一个个体在给定的位点上有AA SNP得分,而配对中的另一个个体在同一位点上有BB SNP得分,这就被认为是亲子关系的孟德尔遗传错误。为了确保测试集中包含所有一级关系,我们选择PI_HAT阈值0.4比Myles等人给出的0.466更低,因此更具有包容性[21]对于对葡萄品种进行的类似研究。使用初始组275,223个SNP时显示少于1000 me(0.36%)的任何配对被认为是潜在的父母后代关系(DUOS)。使用最终设置的253,095个SNP,这个误差阈值减少到600 me(0.24%),以便可以考虑相应的父母后代Duos,以增加置信度。

识别完整的父母后代TRIOS

对于被接受的所有二倍体,可能涉及两个或更多的父母后代关系,我们为所有可能的三人都计算了可能与两个潜在的父母联系起来的所有可能的三人的数量。In addition to errors due to mutually exclusive homozygous SNP scores, ME in complete parent-offspring trios can also be identified when a potential offspring is scored as heterozygous (AB) and both potential parents are scored as homozygous for only one allele, i.e. both AA or both BB. Based on the distribution of ME over all possible trios, groups that showed fewer than 600 ME in the set of 253,095 SNPs were considered as likely complete parent-offspring sets.

涉及三倍体的双亲-子女二组和完整双亲-子女三组的鉴定

八倍体被基因分型并分析,好像它们是二倍体,即,将AAA和BBB基因型和BB分别被视为AB的基因型AAB和ABB。因此,我们将我视为二倍体。识别潜力2n-配子亲本,我们计算了三倍体亲本中纯合子的SNPs和二倍体亲本中杂合子的SNPs,这里称为“tri-hom/di-het”SNPs,作为亲代关系的ME。对于贡献了2的父节点,这个数字应该接近于零n-配子,因为两个等位基因都应该遗传给三倍体后代,除了在2n-通过甲组恢复或乙组恢复而形成的配子。潜在的n-配子亲本推断为上述二倍体基因型。由于一些三倍体品种以前被认为是各种二倍体品种的亲本([27,例如,“里布斯顿皮平”是“考克斯的橘子皮平”的父母),我们开发了以下程序来挑战这种情况。当电位2n- 鉴定了吉盛父母,我们检查了其他人所建议的依赖于三倍体的后代的依赖性,在潜在的2个基因型上n配子(大)的父母。在三倍体杂合子的情况下,其2n-gamete父母是纯合的:i)潜在后代的SNP的数量与与2相同的等位基因纯合n-配子(grand)亲本或杂合子,ii)与潜在2等位基因纯合子的潜在后代的snp数量n配子(大)的父母。第二类中snp的缺失(或几乎缺失)表明假定的三倍体中介体没有传递从另一类(n-配子)的亲本,因此可以排除三倍体作为该个体的潜在亲本。

亲子对子定位,历史资料整合

对于推断出在父母后代的所有代数,无法被识别为三人组,我们试图确定哪个个人是父母,哪个个人是后代。我们首先考虑了,在三人组中被确定为后代的人必须是其参与的任何其他Duos中的父母;因此,二重奏的第二个是被认为是后代。随后,以这种方式识别的任何后代只能被认为是进一步二重奏中的父母,因为其他人将预期将被识别为TRIO中的其他父母。因此,根据这种迭代过程逐步构建群。

然后,我们使用历史数据来定位额外的二重奏:如果二人组织中的一个人已经被记录为另一个人的后代,我们认为这可能是这种情况。在Duo中的两个人可以找到记录的日期,我们认为最近约会的人最可能是后代。然后将相同的迭代过程应用于进一步额外的二重奏,其既不报告的父母也不报告父母,也不是发起的始发导向。

父母-子女二人组祖父母夫妇的身份鉴定

对于未被识别为三重奏的一部分的父母后代二人,其中失踪父母的两个潜在父母,即祖父母夫妇在可能的情况下被识别出来。要做到这一点,我们认为那些SNPS,潜在的祖父母均为给定的等位基因和:(i)后代被评为交替等位基因的纯合,或者(ii)被评分为杂合和可接受的父母被评为与潜在的祖父母相同的等位基因纯合。我们使用了一组25,310个SNP,以减少计算时间并保留潜在的祖父母,仅报告少于100 Me(0.40%)。随后,我们进一步检查了由祖父母,父母和后代组成的组,通过计算253,095个SNP中的我的数量。最后,在253,095个SNP(0.04%)中,祖父母夫妇,父母和后代的父母和后代被认为是可能的祖父母 - 父母后代集。从这个过程中排除了分离种群和三倍体。

谱系从所有结果推导出来

所有推断出来的三人组、面向的二人组和祖父母-父母-后代组被用来生成一个大的谱系文件,可以使用Pedimap软件浏览[57.].同样,这两个分离种群不包括在该血统中。

软件

ME计数使用存放在SourceSup (https://sourcesup.renater.fr/projects/outbredpedigree/).R包" snpStats " [71.]用于在R中载于R.包装“网络”中的SNP数据72.,用于生成Fig。2.rosnertest用于识别杂合子的异常值属于包装“envstats”[73.].

可用性数据和材料

目前研究中使用的所有SNP基因分型数据已存放在InRA DataSet Archive中(https://data.inra.fr/) 在https://doi.org/10.15454/IOPGYF

缩写

我:

孟德尔的错误

MUNQ:

苹果独特的基因型代码

NFC:

国家水果收藏,英国

单核苷酸多态性:

单核苷酸多态性

SSR:

简单序列重复或微卫星

参考

  1. 1。

    Visscher PM,Hill WG,Wray NR。基因组学时代的遗传性 - 概念和误解。NAT Rev Genet。2008; 9(4):255-66。

    PubMedCAS谷歌学者

  2. 2.

    Visscher PM, Medland SE, Ferreira MAR, Morley KI, Zhu G, Cornes BK等。从全基因组的同宗血统共享的遗传力的无假设估计。公共科学图书馆麝猫。2006;2(3):出价。

    PubMed公共医学中心谷歌学者

  3. 3.

    Bérénosc,ellis pa,Pilkington JG,Pemberton JM。估计野生种群的定量遗传参数:血统和基因组方法的比较。Mol Ecol。2014; 23(14):3434-51。

    PubMed公共医学中心谷歌学者

  4. 4.

    FernándezJ,Villanueva B,Pong-Wong R,ToroMá。在保护计划中使用血统和分子标记信息的效率。遗传学。2005; 170(3):1313-21。

    PubMed公共医学中心谷歌学者

  5. 5.

    Lucena-Perez M,Soriano L,López-Bao JV,Marmesat E,FernándezL,Palomares F等人。濒临灭绝的伊伯利亚LYNX中的生殖生物学和家谱:保护的影响。妈妈biol。2018; 89:7-13。

    谷歌学者

  6. 6。

    Bink Mcam,Jansen J,Madduri M,Voorrips Re,Durel C-E,Kouassi Ab,等。贝叶斯QTL使用股份地区的群体QTL进行分析,应用于苹果果实的果实。Al Appl Genet。2014; 127(5):1073-90。

    PubMedCAS谷歌学者

  7. 7。

    Bink MCAM, Boer MP, ter Braak CJF, Jansen J, Voorrips RE, van de Weg WE。系谱植物群体复杂性状的贝叶斯分析。Euphytica。2008;161(2):85 - 96。

    谷歌学者

  8. 8.

    和平CP,润滑剂JJ,Van de Wwe,MC A。M B,IEZZONI AF。为苹果,桃子和甜樱桃制定系统QTL验证的代表性种质集的策略。树遗传学基因组织。2014; 10:1679。

    谷歌学者

  9. 9.

    Dussault FM, Boulding小等位基因频率对精确亲本分配所需的单核苷酸多态性数量的影响:以大西洋鲑鱼为例说明的一种方法学。Aquac杂志2018;49(3):1368 - 72。

    谷歌学者

  10. 10。

    mcure MC, McCarthy J, Flynn P, McClure JC, Dair E, O’connell DK,等。在国家牛肉和奶牛系统中的SNP数据质量控制和高度精确的基于SNP的血统验证和鉴定。麝猫。2018;9:84。

    PubMed公共医学中心谷歌学者

  11. 11.

    Calus议员,Mulder HA, Bastiaansen JW。兄弟姐妹孟德尔基因多态性与家系信息的不一致性鉴定。Genet Sel Evol. 2011;43:34。

    PubMed公共医学中心谷歌学者

  12. 12.

    基于基因型的家系群体样本大小的估算。在:Gondro C, van der Werf J, Hayes B,编辑。全基因组关联研究和基因组预测。风险:胡玛纳出版社;2013.[引用2013年10月18日]。p . 395 - 410。可以从:http://www.springerprotocols.com/Abstract/doi/10.1007/978-1-62703-447-0_17

    谷歌学者

  13. 13.

    Ellstrand NC。狂野萝卜的果实内的多种父亲,萝卜.Nat。1984;123(6):819 - 28。

    谷歌学者

  14. 14.

    Gowaty PA, Karlin AA。明显是一夫一妻制的东部蓝知更鸟的单窝多母性和父性(Sialia Sialis.).表现Ecol Sociobiol。1984; 15(2):91-5。

    谷歌学者

  15. 15.

    伯克·T·布鲁福德鸟类的DNA指纹。大自然。1987;327(6118):149 - 52。

    PubMedCAS谷歌学者

  16. 16。

    Jeffreys AJ, Morton DB。狗和猫的DNA指纹。动物麝猫。1987;18(1):1 - 15。

    PubMedCAS谷歌学者

  17. 17。

    Nybom H,Schaal Ba。DNA“指纹”应用于苹果的亲子鉴定(马鲁斯x有明显).中国科学(d辑:地球科学)1990;79(6):763-8。

    PubMedCAS谷歌学者

  18. 18。

    引用本文:拉孔be, Boursiquot J-M, Laucou V, Vecchi-Staraz MD, Péros葡萄l .)。acta photonica sinica, 2013;126(2): 401-14。

    PubMed谷歌学者

  19. 19.

    Testolin R,Marrazvo T,Cipriani G,Quarta R,Verde I,Dettori Mt,等。桃子中微卫星DNA(碧桃L. Batsch)及其在指纹识别和测试品种遗传起源中的用途。基因组。2000; 43(3):512-20。

    PubMedCAS谷歌学者

  20. 20。

    Howard NP,Van de Weg E,Bedford DS,和平CP,Vanderzande S,Clark MD等。通过用多种多数的综合SNP联系地图和大苹果来阐明“蜂巢克里斯普”谱系通过单倍型分析(马鲁斯×有明显)系谱关联SNP数据集。Hortic杂志2017;4:17003。

    PubMed公共医学中心谷歌学者

  21. 21。

    Myles S,Boyko AR,欧文斯Cl,棕色PJ,Grassi F,Aradhya Mk等。葡萄的遗传结构和驯化史。PROC NATL ACAD SCI。2011; 108(9):3530-5。

    PubMedCAS谷歌学者

  22. 22。

    Telfer EJ, Stovold GT, Li Y, Silva-Junior OB, Grattapaglia DG, Dungey HS。亲子关系重建桉树nitens使用SNP和微卫星标记:标记数据功率和鲁棒性的比较分析。Plos一个。2015; 10(7):E0130601。

    PubMed公共医学中心谷歌学者

  23. 23。

    Jones AG, Small CM, Paczolt KA, Ratterman NL。亲子关系分析方法的实用指南。生态学报。2010;10(1):6-30。

    PubMed谷歌学者

  24. 24。

    Cornille A,Gladieux P,Smulders MJM,Roldán-Ruiz I,Laurens F,Le Cam B等人。新洞察驯化苹果史:欧洲野生苹果对栽培品种基因组的二次贡献。Plos Genet。2012; 8(5):E1002703。

    PubMed公共医学中心CAS谷歌学者

  25. 25.

    Juniper BE, Mabberley DJ。苹果(互联网)的故事。波特兰:木材出版社;2006.[引用2018年6月11日]。219页,可从:http://www.timberpress.com/books/story_apple/juniper/9781604691726

    谷歌学者

  26. 26.

    Leroy A. pomologie词典:内容l ' historire, la description, la figure of fruits des anciens and des fruits les plus généralement connus et cultivés。巴黎:pripriie Lachèse, Belleuvre and Dolbeau;1873.

    谷歌学者

  27. 27.

    史密斯M.英国国家苹果注册处。农业、渔业和食品部:伦敦;1971.

    谷歌学者

  28. 28。

    苹果的新书:苹果的权威指南,包括2000多个品种。的精彩;2002.p。328。

    谷歌学者

  29. 29。

    罗奇。英国的栽培水果:起源和历史。牛津大学:布莱克威尔;1985.p。349。

  30. 30.

    Gross Bl,Henk Ad,Richards Cm,Fazio G,Volk Gm。遗传多样性马鲁斯×有明显(Rosaceae)通过时间响应驯化。我是J机器人。2014; 101(10):1770-9。

    PubMed谷歌学者

  31. 31.

    Noiton DAM, Alspach PA。现代苹果品种的无性系、近交、同族和地位数的建立。acta Hortic sinica(地球科学学报),1996;121(5):773-82。

    谷歌学者

  32. 32。

    王志强,王志强,王志强,等。通过对大量种质资源的遗传多样性和结构分析表明,苹果在欧洲水平上存在显著的基因流动。BMC Plant Biol. 2016;16:130。

    PubMed公共医学中心谷歌学者

  33. 33。

    Volk Gm,Bramel P.一种保护全球苹果遗传资源的战略:调查结果。Acta Hortic。2017; 1172:99-106。

    谷歌学者

  34. 34。

    等。苹果(苹果属)。Acta Hortic。1991;290:3-46。

    谷歌学者

  35. 35。

    Bühlmann A, Gassmann J, Ingenfeld A, Hunziker K, Kellerhals M, Frey JE。瑞士水果遗传资源的分子特征。Erwerbs-Obstbau。2015,(1): 57 29-34。

    谷歌学者

  36. 36。

    Ferreira V, Ramos-Cabrer AM, Carnide V, Pinto-Carnide O, Assunção A, Marreiros A, et al.;利用微卫星分析葡萄牙苹果本地品种的遗传库结构。树基因组。2016;12(3):1-15。

    谷歌学者

  37. 37.

    基于SSR和s -等位基因分析的瑞典本地苹果品种的分子特征。Hereditas。2008;145(3):99 - 112。

    PubMedCAS谷歌学者

  38. 38.

    Larsen B,Tellam-Andersen TB,Pedersen C,ØrgaardM.在丹麦苹果基因库集合中解开遗传多样性和品种父母。树遗传学基因组织。2017; 13(1):14。

    谷歌学者

  39. 39.

    张志强,张志强,张志强,等。基于SSR标记的法国苹果种质遗传多样性、群体结构、亲本分析及核心种质构建植物学报。2016;34(4):827-44。

    CAS谷歌学者

  40. 40。

    梁文杰,李志强,李志强,等。意大利苹果品种的遗传多样性、群体结构及核心种质构建。植物学报。2015;33(3):458-73。

    CAS谷歌学者

  41. 41.

    意大利中部苹果种质资源的遗传特征:地方品种的价值。植物学报。2018;9:1460。

    PubMed公共医学中心谷歌学者

  42. 42.

    Patzak J,PapršteinF,HenychováA,SedlákJ,Somers D.苹果中SSR分子标记数据遗传多样性结构分析的比较(马鲁斯×有明显)遗传资源。基因组。2012; 55(9):647-65。

    PubMedCAS谷歌学者

  43. 43.

    王志强,王志强,王志强,等。西班牙阿拉贡地区苹果品种遗传多样性分析。Sci Hortic。2014;174:1-9。

    谷歌学者

  44. 44.

    马可汗,韩玉英,张晓东,张晓东。一种植物的遗传多样性马鲁斯使用简单序列重复的种质(SSR)。植物mol biol报告。2012; 30(4):827-37。

    谷歌学者

  45. 45。

    关键词:苹果,微卫星,基因分型马鲁斯×有明显Borkh。)荷兰的遗传资源:在收集管理和品种识别中的应用。遗传资源作物evol。2010; 57(6):853-65。

    谷歌学者

  46. 46。

    乌拉斯塔卢J,Miranda C,Santesteban L,Royo J.来自MicroTaTellite标记评估的西班牙东北西班牙当地苹果品种遗传多样性和结构。树遗传学基因组织。2012; 8(6):1163-80。

    谷歌学者

  47. 47。

    王志强,王志强,王志强,等。苹果遗传多样性、群体结构和连锁不平衡的研究进展。植物基因组学。2017;13(6):125。

    谷歌学者

  48. 48。

    Pereira-Lorenzo S,Urrestarazu J,Ramos-Cabrer A. M.,Miranda C,Pina A,Dapena E等人。西班牙苹果遗传资源遗传多样性和结构的分析表明,伊比利亚遗传池的存在。Ann Appl Biol。2017; 171(3):424-40。

    谷歌学者

  49. 49.

    陈志强,陈志强,陈志强。苹果品种‘Meran’亲缘关系的解决。Erwerbs-Obstbau。2012年,54(3):143 - 6。

    谷歌学者

  50. 50.

    Cabe Pr,Baumgarten A,Onan K,润滑JJ,Bedford DS。使用微卫星分析来验证育种记录:对“蜂窝状的苹果品种的研究”。Hortscience。2005; 40(1):15-7。

    CAS谷歌学者

  51. 51。

    Evans K,Patocchi A,Rezzonico F,Mathis F,Durel C,Fernández-Fernándezf等。用基因组覆盖物SSRS覆盖物饲料材料的基因分型:培养品种和父母的素质。mol品种。2011; 28(4):535-47。

    谷歌学者

  52. 52。

    Salvi S,Micheletti D,Magnago P,Fontanari M,Viola R,Pindo M等人。Apple中多代谱系网络的一步重建(马鲁斯×有明显borkh。)和金色美味的父母。mol品种。2014; 34(2):511-24。

    CAS谷歌学者

  53. 53.

    Pikunova A,Madduri M,Sedov E,Noordijk Y,Peil A,Troggio M,等。“施密特的Antonovka”与“共同安东尼娃”相同,这是一种广泛用于生物和非生物胁迫的俄罗斯繁殖的苹果品种。树遗传学基因组织。2014; 10(2):261-71。

    谷歌学者

  54. 54.

    Drigce M,Kirdwichai P,Baksh MF,鹿肉EP,Gibbings JG,Dunwell JM。对栽培苹果品种的主要国际收集遗传分析揭示了以前未知的历史异常和近交关系。Plos一个。2018; 13(9):E0202405。

    PubMed公共医学中心谷歌学者

  55. 55.

    陈志强,陈志强,陈志强,等。axiom®Apple480K SNP基因分型芯片的开发和验证。植物j . 2016; 86(1): 62 - 74。

    PubMedCAS谷歌学者

  56. 56.

    等。PLINK:全基因组关联和基于群体的连锁分析的工具集。中国科学(d辑:地球科学)2007;

    PubMed公共医学中心CAS谷歌学者

  57. 57。

    Voorrips RE, Bink MCAM, van de Weg WE。Pedimap:用于系谱遗传和表型数据可视化的软件。J在这里。2012;103(6):903 - 7。

    PubMed公共医学中心谷歌学者

  58. 58。

    Ronald WG, Temmerman HJ。为草原诸省果树。加拿大农业:渥太华;1982.

    谷歌学者

  59. 59。

    种子植物、植物种子、植物种子等。r . stephani (Parisiis);1540[引用2019年1月8日]。可以从:https://gallica.bnf.fr/ark:/12148/bpt6k52172m

    谷歌学者

  60. 60。

    苹果和它的变种。伦敦:新郎桥和儿子们;1859.p。336。可以从:https://fr.slideshare.net/FalXda/l3f536-17328884

    谷歌学者

  61. 61.

    Mayer J.In:Winterschmidt AW,编辑。Pomona Franconica OderNatürlicheAbbildungund Besbreibung der Besten undVorzüglichstenGattungenderoblbäumeundfrüchtewelche在德国何福尔斯利克省HofgartenZuwürzburgGezogenWerden。纽伦堡:Winterschmidt;1779.获得:https://books.google.fr/books?id=s4bitaeacaaj.

  62. 62.

    大众汽车,亨克AD。美国历史苹果品种的鉴定和有效性。中国科学:地球科学,2016;41(3):292-301。

    谷歌学者

  63. 63。

    未知苹果的鉴定(马鲁斯×有明显)品种展示影响本地育种计划的品种多样性。植物遗传资源学报。2018;65(5):1317-27。

    谷歌学者

  64. 64。

    Darlington CD, Moffett AA。初、次染色体平衡Pyrus..J麝猫。1930;22(2):129 - 51。

    谷歌学者

  65. 65.

    利用同工酶、随机扩增多态性DNA (RAPD)和限制性片段长度多态性(RFLP)标记来推断‘Braeburn’苹果的假定亲本。acta Hortic sinica, 1996; 21(6): 996-1001。

    CAS谷歌学者

  66. 66.

    Trainin T, Zohar M, Shimoni-Shor E, Doron-Faigenboim A, Bar-Ya 'akov I, Hatib K,等。在早熟苹果材料中发现了一种独特的单倍型,可以作为低冷要求苹果育种的标记。摩尔品种。2016;(11):158。

    谷歌学者

  67. 67.

    山WG,白色IMS。基因组共享的血统关系鉴定。G3基因基因组群。2013; 3(9):1553-71。

    谷歌学者

  68. 68.

    王志强,王志强,王志强,等。苹果开花期和成熟期的全基因组关联定位。植物学报2017;8:1923。

    PubMed公共医学中心谷歌学者

  69. 69。

    Fernandez-Fernandez F.指纹全国苹果和梨系列[互联网]。2010.提供:http://sciencesearch.defra.gov.uk/document.aspx?document=gc0140sid5fingerprintingfernandez.pdf.

    谷歌学者

  70. 70.

    林smith G, Becker C, Choisne N, Schijlen E, et al.;苹果基因组的高质量从头组装和果实早期发育的甲基组动态。Nat麝猫。2017;49(7):1099 - 106。

    PubMedCAS谷歌学者

  71. 71.

    Clayton D. snpstats:snpmatrix和xsnpmatrix类和方法。2014.(r包版本1.16.0)。

    谷歌学者

  72. 72。

    Butts C.网络:用于管理R. J STAT软件中的关系数据的包。2008; 24:2。

    谷歌学者

  73. 73.

    Millard SP。Envstats:用于环境统计数据的R包。纽约:斯普林克;2013年。

    谷歌学者

下载参考

致谢

作者感谢Walter Guerra博士和意大利Laimburg Research Center的Thomas Letschka博士,提供了来自Laimburg Germplasm Collection的13种附加(编码'LB399_xxx')的叶子样本。The authors also thank Dr. Tal Isaacson from Volcani Center, Agricultural Research Organisation, Israel, for providing two DNA samples (accession names ‘Golden Dorsett’ and ‘Hashabi (MH. 10-1)’) and information and references about cultivars ‘Golden Dorsett’ and ‘Anna’. The staff at the GENTYANE genotyping platform (especially Dr. Charles Poncet and Anthony Theron, INRA, Clermont-Ferrand, France) and at the Unité Expérimentale Horticole (INRA, Angers, France) are warmly acknowledged for producing additional SNP genotyping data and for maintaining the INRA apple germplasm collection, respectively. The authors thank the GenoToul (http://bioinfo.genotoul.fr/)生物信息学平台,提供计算机设备的访问。作者感谢三位审稿人提出的富有洞察力和建设性的意见。

资金

这项工作主要由Fruitbreedomics项目(FP7-KBBE-2010号265582)的欧盟第七框架计划(FP7-KBBE-2010号):果树作物中育种效率增加的综合方法(http://www.cruitbredomics.com/);本著作中所表达的观点由作者全权负责,并不一定反映欧盟委员会的观点。资助机构在研究的设计、数据的收集、分析和解释以及手稿的撰写中都没有发挥任何作用。

作者信息

隶属关系

作者

贡献

HM设计了研究,分析和解释了数据,并撰写了手稿。HM和CD分析了原始SNP数据,收集信息以生成“记录日期”或“记录父母身份”。CD对数据分析做出了贡献。JLC和YB验证并记录了许多日期,并强调了“Reinette Franche”在整体谱系中的主要贡献。HN和MO确认并记录了许多父母,并强烈修改了手稿。LF, ST, MT, ML, FP验证并记录了亲缘关系并修改了手稿。FL作为FruitBreedomics EU项目和修订手稿的协调人,强烈支持这项研究。CED构思并监督了这项研究,解释了结果并共同撰写了手稿。所有作者阅读并批准了最终的手稿。

通讯作者

对应于海琳Muranty

道德声明

伦理批准和同意参与

不适用。

同意出版

不适用。

相互竞争的利益

提交人声明他们没有竞争利益。

附加信息

出版商的注意

施普林格《自然》杂志对已出版的地图和机构附属机构的管辖权要求保持中立。

补充信息

附加文件1:表S1。

1433的唯一列表马吕斯有明显涉及该研究的个人(MUNQ),加入的登录数量用于代表MUNQ的基因分型(加入代码),归因于MUNQ(首选名称)的首选名称,以及其简短版本(首选名称简短),基因分型的原始原因,Munq(原产地),它们的倍性水平(倍增),原产地,第一个描述,介绍,录制或包含在与首选名称(日期)相对应的品种的收集中,以及参考要记录日期(日期的来源)。

附加文件2:表S2。

本研究中使用的253,095个健壮单核苷酸多态性及其染色体位置和染色体上的位置。位于18号染色体上的单核苷酸多态性是那些位于contigs或scaffold上而不能归属于染色体的单核苷酸多态性。位于19号染色体上的snp是那些没有明确位置的snp(探针没有BLAST结果,或者有几个相同的结果)。在“in.25 K子集”一栏中用“yes”表示是否包含一个SNP。

附加文件3:表S3。

完整的家长后代TRIOS推断,少于600颗孟德尔错误(ME),指示后代的首选名称(首选名称后代)及其MUNQ(MUNQ O),父母的首选名称(首选名称P1,首选名称P2)和他们的Munq(Munq P1,Munq P2),我的数量(#me),预定的父母(来自文学,文学的父母2的parent1)和本文档的来源(source_parents),具有文学的推断父母的一致性(p1_confirmed和P2_confirmed), consistency of dates, i.e. offspring younger than its inferred parent(s), on the basis of documented dates indicated in Additional file1:表S1(日期一致P1和日期一致P2)。前143行列出了预先确定的亲本(s),而其余的则在下面。在每一部分中,这三个人是根据后代喜欢的名字的字母顺序排列的。在确定假设父母时,根据文献对P1和P2的父母进行排序。对于剩下的三个孩子,父母被任意地归因于P1和P2。

附加文件4。

用于识别原产地的日期,首先描述,介绍,在集合中录制或包含根据首选名称的父母或父母的来源列表。

附加文件5:表S4。

面向Parent-Offspring搭档推断少于600孟德尔错误(我),指示首选的后代(首选名称的后代)及其MUNQ (MUNQ O),家长的首选名称(首选名称P)及其MUNQ (MUNQ P),我(#我)的数量,预设的父母的后代(Parent1从文学,父母2来自文献)和本文档的来源(Source_parents),推断的父母与文献的一致性(确认了一个父母),日期的一致性,即后代比推断的父母年轻,根据附加文件中显示的记录日期1:表S1(日期一致)。在前25行中列出了预先确定的父母,而其余的则在下面。在每一部分中,二人组都根据后代喜欢的名字按字母顺序排序。

附加文件6:表S5。

Non-Oriented Parent-Offspring duo推断出小于600孟德尔错误(ME),表明这对夫妇中的两个个体(preferred name Ind1, preferred name Ind2)和他们的MUNQ (MUNQ Ind1, MUNQ Ind2, ME的数量(# ME),假设后代(假设后代)和假设父母(假设父母)的MUNQ,当有假设取向来源(使用取向)时,两个个体的假设父母(文献中的Ind1_Parent1,文献中的ind1_paren2,文献中的Ind2_Parent1,Ind2_Parent 2来自文献)和这些文档的来源(Source_parents_ind1, Source_parents_ind2), ind1和ind2的记录日期如附加文件所示1:表S1,并根据日期指示方向的可能性(日期一致性)。在前44行中列出了基于记录的父母身份的组合(在“使用导向”一栏中注明),并根据假定后代的首选名字按字母顺序排序。接下来的161行列出了基于两个个体的记录日期的二人组,并从最老的到最近的假定父母进行排序;接下来列出了43个二人组,因为其中一个人被认为是二人组中的孩子,这是根据先前记录的父母或日期;它们是从最老的到最近的所谓父结点;接下来列出了在第二轮中面向的两个组合。接下来列出了51对组合,其中日期只列出了一个人:这个人随后被归为Ind2,所有这些组合都是从最古老的Ind2到最近的Ind2排序。接下来列出了7对情侣,他们的约会日期对双方都是可行的,但太不精确或太老,无法实现定向。其余22对既没有日期也没有父母证明文件的夫妇被列在最后;在这些组合中出现最频繁的个体被归为Ind2,所有这些组合都是根据Ind2的首选名称按字母顺序排序的。

附加文件7:表S6。

以小于100个孟德尔错误(ME)推断的祖父母、父母和后代组,表明后代(offspring)、父母(parent)和祖父母(GrandParent 1, GrandParent 2)的首选名称,即缺失父母的父母夫妇及其MUNQ (MUNQ O, MUNQ P, MUNQ GP1, MUNQ GP2),我25 K SNP的数量设置(#我25 K)和253 K SNP(#我253 K),预设的后代的父母(父母Parent1从文学、从文献2)和源文档(Source_parents),推断出父母的一致性与文学(Ped_consistency),日期的一致性,即后代比其推断的祖父母(或祖父母)年轻,根据附加文件中显示的记录日期1:表S1(日期一致GP1和日期一致GP2)。

额外的文件8。

从目前工作推断的二倍体之间的所有关系中推断出血统。可以使用pedimap软件打开文件[57.].品种名称在他们的短版本中(附加文件1:表S1)。“indic”列表示谱系中个体已知的信息水平:1,创始人;2、未知个体,以双亲已知;3、半创始人(父母一方已知,一方未知);4、双亲都已知的已知个体。(ZIP 13 kb)

附加文件9:图S1。

家族血统将创始人“卡尔维尔·胭脂”与其所有后代联系在一起,超过三代。品种名称的简短版本(见附加文件)1表1)。名称条的颜色表示系谱中个体已知的信息水平:蓝色表示双亲都已知的个体;奶油,单亲个体;橙色,父母双方都知道的未知个体;深绿色叶,创始人。关系用黑线表示,因为我们的数据无法识别母亲和父亲。图是使用从附加文件中提取的数据绘制的8和Pedimap软件[57.

附加文件10:图S2。

1425个二倍体个体杂合度的分布。

附加文件11:图S3。

10720对二倍体-三倍体中孟德尔误差(ME)的分布马吕斯有明显个体被测试为亲子二人组。推断parent-offspring配对涉及父母给一个二倍体配子三倍体的后代占在浅灰色酒吧(inf.UNG par-O搭档),推断parent-offspring配对涉及父母给的单倍体配子三倍体的后代在深灰色的酒吧(inf. haplG par-O搭档),full-sib配对的粉红色酒吧(FS), half-sib配对通过父母给一个二倍体配子三倍体的后代在浅蓝色酒吧(HS) par。)half-sib或grand-parent-grand-child关系通过父母给予一个二倍体配子的三倍体的后代中蓝色酒吧(HS或通过)GP-GC标准。)half-sib配对通过父母给的单倍体配子三倍体的后代在蓝色酒吧通过haplG par (HS), half-sib或grand-parent-grand-child关系通过父母给的单倍体配子三倍体的后代在深蓝色的酒吧(HS或通过haplG par GP-GC。),和其他配对在紫色的酒吧(未知)。在左边,所有测试对都被表示。在右侧显示小于500 ME的对。

附加文件12:表S7。

关系确定为三倍体推断少于300孟德尔错误的音色,(我),与父和少于1200 tri-hom / di-het二倍体配子,指示首选的三倍体(三倍体的后代)及其后代MUNQ (MUNQ O),母公司的首选的名字给一个二倍体配子(2n-gamete父母)及其Munq(Munq 2n P),Duo Triploid-2的我数量n-gamete父(#me 2n p),Duo triploid-2n-gamete父母父母(#hom-het)的Tri-hom / di-het snps的数量,父母的首选名称给出单倍体配子(n-配子父母)及其MUNQ(MUNQ N P),我的DUO TRIPLOID-N-GARATE父母的数量(#me n p),当可用时,trio的数量(#me trio)。

额外的文件13。

关于所获得的结果的历史和遗产价值的附加讨论要点

权利和权限

开放访问本文遵循知识共享署名4.0国际许可协议(http://creativecommons.org/licenses/by/4.0/)如果您向原始作者和源给出适当的信用,则允许在任何介质中进行不受限制的使用,分发和再现,提供指向Creative Commons许可证的链接,并指示是否进行了更改。Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本条提供的数据,除非另有说明。

再版和权限

关于这篇文章

通过CrossMark验证货币和真实性

引用这篇文章

Muranty, H., Denancé, C., Feugey, L.等等。利用全基因组SNP数据重建苹果种质多代大系谱。BMC植物杂志20.2(2020)。https://doi.org/10.1186/s12870-019-2171-6

下载引用

关键词

  • 马吕斯有明显
  • 基因分型
  • 亲子关系分析
  • Parent-offspring
  • 创始人
  • 种质收集
  • 经验选择
  • 现代育种