跳过主要内容

连续的古四倍体化形成胡萝卜基因组

摘要

背景

胡萝卜(胡萝卜胡萝卜无性系种群。胡萝卜L.)是具有可用优质基因组的重要根作作物。Carrot Genome被认为已经经历了递归古多元化化,但这些事件的程度,事件和性质没有明确定义。

结果

利用之前发表的比较基因组学方法,我们重新分析了胡萝卜基因组,描述了两个四倍体化事件后的基因组片段,以及基因丢失和保留,并推断出每个事件的显性和敏感的亚基因组。特别是,我们发现了两个连续四倍体化事件的有力证据,其中一个(Dc-α)大约在4600 - 5200万年前(Mya),另一个(Dc-β)大约在77-87年(Mya),两者都可能在自然界中发生异源四倍体化。Dc-β事件可能是所有Apiales植物共有的,发生在Apiales- bruniales分化前后和Apiales- asterales分化之后,可能在Apiales物种的衍生和分化中起重要作用。此外,我们发现,多倍体事件的轮数有助于负责质体甲基赤藓醇磷酸(MEP)的基因家族的扩展,这是类胡萝卜素积累的前体,并形成了潜在的调控途径。与多倍体化和物种形成不同事件相关的同源和同源基因的比对,构成了研究Apiales、Asterales和许多其他相关物种的比较基因组学平台。

结论

同源性的分级推断揭示了胡萝卜基因组的两个四倍化事件,这可能有助于Apiales植物的成功建立和类胡萝卜素积累途径上游MEP的扩展。

背景

胡萝卜胡萝卜无性系种群。胡萝卜胡萝卜是最重要的蔬菜作物之一,因为它是维生素a和类胡萝卜素的主要来源[12].胡萝卜属c .胡萝卜属于订单Apiales内的苹果藻家族,在露营地的人物内,其中包括订单群(如备份物种)Lactuca satival或向日葵L.)[3.].Lamiids是Campanulids的一个亲密姐妹分支,包含了许多在农业上具有重要意义的物种,它们分布在几个目中,如龙胆(如:Coffea canephoraPierre Ex A. Frohner,斯伯里亚双重镰状(保留&调查。)钩。F. & Thomson ex C.B. Clarke)或Solanales(例如:Solanum muricatum.奥顿,Solanum Tuberosum.L.)[4.].露营地和拉米氏蛋白的分支属于一群姐妹罗西群岛(例如,葡萄在Eudicots分支内[5.].

古代多倍体化事件在陆生植物的进化中发挥了重要作用,促进了陆生植物的起源和多样化[6.7.8.9.10.].胡萝卜是第一个被完全测序的伞形科物种。通过基因组比较,认为胡萝卜基因组可能受到了两个多倍化事件的影响,以前称为Dc-α和Dc-β,可能导致全基因组三倍化(× 3)和全基因组重复事件(× 2) [11.], 分别。然而,对这些事件产生的顺序,发生和所得复制基因的详细解释仍然难以捉摸。这主要是由于胡萝卜基因组的复杂性,这使得经历了递归回收的多倍化。

除了上述事件,胡萝卜和其他申逊(例如,咖啡和葡萄)分享了一个更古老的核心才常见的六倍(ech)祖先,最初透露拟南芥基因组(12.后来详细介绍了葡萄基因组[13.14.].在多倍体化之后,基因组往往是不稳定的,并遭受广泛的分裂,许多基因丢失,染色体片段重排,染色体数目减少,最终产生高度复杂的基因组,基因组内同源性相互交织[7.8.9.10.].

这些序列的古多倍化事件不仅使它们的基因组结构难以解旋,而且使它们的组成和功能难以确定。显然,不充分的分析导致对全基因组和关键基因家族的结构、进化和/或功能创新的错误解释[15.16.17.18.].我们最近开发了一种涉及同源基因的管道,并表征事件相关的基因共同性,以帮助分析复杂基因组。用葫芦科基因组的实施该管道揭示了〜100万年前(Mya)发生的忽略的古单型翻转事件,这可能有助于整个葫芦科家族的建立和快速分歧[19.].

在这里,使用特征鲜明的葡萄(V. Vinifera)和咖啡(c . canephora)基因组作为参考,我们重新分析了胡萝卜基因组,这些基因组相对简单,可能不受ECH后任何多倍体事件的影响。我们设法推断多倍体化事件的规模、性质和时间。随着管道的发展,我们产生了共线性支持的副同源和同源基因,这些基因与每一个多倍体化和物种形成事件相关。深入分析表明,几轮多倍体事件促成了类胡萝卜素积累基因家族的扩展,并形成了胡萝卜基因组中潜在的调控途径。

结果

同源基因的共线性

我们使用Colinearscan推断在每个基因组内和胡萝卜和咖啡或葡萄参考基因组之间的共线基因[20.,它提供了一种评估共线基因块的统计意义的功能额外的文件2表S1和S2)。在具有4个或4个以上共线基因的区块中,我们发现胡萝卜中重复基因的数量最多(1192-7142对),葡萄中重复基因的数量最少(111-1831对),而咖啡中包含408-2436对额外的文件2表S1)。胡萝卜基因组还保留了与葡萄(61基因对)或咖啡(95基因对)相比的最长的共线片段(122基因对)。这表明胡萝卜具有更复杂和共线的基因组。

在基因组间同源性方面,三个基因组间共线基因对15712 - 20939对额外的文件2表S1)。对于具有四种或更多种聚合物基因的嵌段,葡萄和胡萝卜之间的共线基因的数量较高,并且共线嵌段比葡萄和咖啡之间的线块短。对于具有> 50个共线基因的嵌段,与56个葡萄咖啡嵌段(平均112.95个共线基因的平均值),有34个葡萄胡萝卜块(平均74.94基因)。胡萝卜和咖啡基因组之间的块优于胡萝卜和葡萄基因组之间的块。这些发现可以通过胡萝卜基因组中的额外多倍化事件发生来解释,这可能导致更大的基因组分级额外的文件2表S1和S2)。

两起古四倍体化事件的证据胡萝卜属c .胡萝卜

利用上述共线基因对,我们估计了各共线基因对之间的同义替代差异(Ks)。胡萝卜中的Ks分布具有明显的三峰结构,峰值分别为0.551(+/−0.06)、0.944(+/−0.176)和1.390(+/−0.099)。无花果。1一种;该结果表示三种大规模的基因组重复事件,可能分别对应于先前名为DC-α,DC-β和ech的事件的多倍化事件。

图1
图1

共线基因(Ks)之间的原始和校正同义核苷酸替换。Dc -α,最近tetraploidization;Dc -β,Apiales-common tetraploidization;决定,core-eudicot-common hexaploidization;。连续曲线表示k在基因组内的分布,断裂曲线表示k在基因组间的分布。一种使用原始Ks值拟合的分布;B.推断方法;c分布使用修正的Ks值拟合;D.推断进化的日期

使用同源基因偶像仪,我们用每个两个基因组之间的每个块的中值筛选的块,并设法定位同源对应,以区分原始地区,这些区域是由于植物之间的分裂而建立的,这些地区是由于共享而建立的多倍化事件(附加文件1数字。S1-3)。在葡萄胡萝卜达普兰,19种葡萄染色体以七种颜色显示,对应于七颗七祖氏才染色体,每个染色体在远端葡萄基因组中具有三个同源区域[13.14.].对于葡萄胡萝卜Dotplot的一个胡萝卜染色体区域额外的文件1数字S2),由于其更好的DNA相似性(更多的Consear基因和较小的中位数Ks)与葡萄中的葡萄片中的较好的DNA相似性(更多的共线基因和较小的中位数Ks)推断出,后者与ECH相关。通常,这些措施一致地推断用于区分从分选者的外部块。因此,我们概述了使用具有固体和虚线的矩形的正交区域,以区分不同的不同来源来自两个额外的重复事件额外的文件1数字。S2和S3)。由于广泛和互补的基因丢失,在某些没有共线基因痕迹的远缘区域[21,葡萄染色体之间的同源性和/或葡萄与胡萝卜之间的同源性可作为递推性指标来表明异源区域之间的实际同源性。咖啡-胡萝卜点图的分析加强了我们对葡萄和胡萝卜的推断额外的文件1数字S3)。

如果胡萝卜中存在额外的六倍体化和四倍体化事件,如Iorizzo等报道的[10.,假设没有DNA丢失,我们可以预期一个葡萄基因(或染色体区域)有6个最匹配或同源胡萝卜基因(染色体区域)和12个同源基因(染色体区域)。在这里,我们的研究结果显示,作为一个例子,Vv5, Vv7,和很大一部分的Vv14是由ECH(我们用Vv来表示葡萄染色体(葡萄)和DC表示胡萝卜的染色体(Daucus Carota.))。我们发现Vv5在胡萝卜染色体1、7、8和9中有4个最佳匹配或同源副本(图。2一种.由红色矩形盘旋的块分别包含140,190,258和155个用于染色体1,7,8和9的共线基因。这四个最佳匹配区域中的每个块的中位数约为1.085,对应于葡萄胡萝卜祖先的分歧。胡萝卜中的Vv5的正交区域各自对来自VV7和VV14的染色体区段分选,并且预期的块在图2中突出显示。2A乘浅蓝色矩形。在其他同源基因块中发现的共线基因较少(Vv7-Dc1, 42个共线基因;Vv14-Dc1 18;Vv7-Dc7 57;Vv14-Dc7 57;Vv7-Dc8, 70;Vv14-Dc8, 62;Vv7-Dc9 60;Vv14-Dc9 48)。

图2
figure2

胡萝卜和葡萄之间的同源基因圆顶的实例。显示胡萝卜和葡萄染色体数字。最佳击中基因由红色点表示,次级命中作为蓝色点,另一个作为灰度点。一种葡萄和胡萝卜染色体之间的最佳匹配或直向性副本。B.胡萝卜染色体上的副同源区(D1至D9)与葡萄的三个染色体区(V5、V7和V14)相对应。C显示基因共线性的块。共线区域上的数字是中位数k

相应地,关于葡萄胡萝卜德普洛特揭示了正轨的位置信息,我们鉴定了胡萝卜中的副骨区。红萝卜染色体1,9和7,8中的副寄生区域被分成两组(图。2b).每一组由红色(在染色体1和9之间)和淡红色(在染色体7和8之间)矩形圈出的块分别包含120和256个共线基因。这些区块的中位Ks约为0.551,对应于相对较新的四倍体化(命名为Dc-α)(图。2c).两组之间用灰色矩形圈出的4个区包含46 (Dc1-Dc7)、88 (Dc1-Dc8)、66 (Dc7-Dc9)和115 (Dc8-Dc9)共线基因。这些区块的中位Ks约为0.944,对应更古老的四倍体化事件(命名为Dc-β)。由于基因丢失或易位,一些块不在预期的染色体区域,用灰色虚线圈出的矩形表示(图。2c)。

采用与Vv7相似的策略,对胡萝卜的同源区域和基因进行了鉴定,发现第3和第5染色体之间和第1和第2染色体之间的同源性(谬误)是由Dc-α产生的,而上述两组之间的同源性是由Dc-β产生的(图2)。2a - c)。在Vv14片段中,由于Dc-β和Dc-α的组合,Dc-α产生的相应的同源区域和基因也在两组中被鉴定出来,分别在染色体1和6和染色体7和9中。2a - c)。最终,我们鉴定了胡萝卜中的各自的正非地区;葡萄亚吡咯染色体具有不同的正交区域,每个副本具有四个最佳匹配的副本(图。2a).在胡萝卜中,相应的同源区域往往被分割成更小的区域,甚至由于多倍体化后基因丢失和染色体重排而不存在。幸运的是,复制导致了相似的断裂点、断裂方向和断裂片段的模式,这使我们可以推断它们来自同一祖先的染色体或相同的复制事件。一个胡萝卜染色体区域通常对应一个最佳匹配和两个次级匹配的染色体区域(图。2c).从咖啡-胡萝卜同源基因点图中,我们发现在咖啡3号染色体的一个很大的片段中,胡萝卜基因组中有4个最佳匹配额外的文件1数字S4)。四个最佳匹配的地区是胡萝卜染色体1,8和7,9,这代表了胡萝卜中两种古同等的重组事件的最强证据。除了上述葡萄和咖啡染色体的上述例子外,所有其他葡萄和咖啡染色体类似地显示了两组最佳匹配的胡萝卜染色体区额外的文件1数字。S2和3)强烈支持从葡萄,咖啡和其他申办者分裂后胡萝卜中的两个古同等四倍化的概念无花果。3.

图3
图3

胡萝卜、咖啡和葡萄基因组的物种和基因系统发育树。胡萝卜(D)、咖啡(C)和葡萄(V)的系统发育树:ECH用蓝色闪电表示,两个胡萝卜古四倍体化事件用红色闪电表示。b基因系统发育:葡萄和咖啡基因组中的三个副同源基因分别是V1、V2、V3和ECH产生的C1、C2、C3,胡萝卜基因组中每一个都有四个同源基因和八个异同源基因。例如,V1在胡萝卜中有四个直系基因D11、D12、D13、D14和八个直系基因D21、D22、D23、D24、D31、D32、D33、D34。该种树是根据我们目前对同源基因的分析而产生的

我们还进行了基因系统发育分析,以获得额外的证据,以支持胡萝卜中的两个古同等四倍体化事件。对于371个过滤的葡萄基团,具有至少三种彻底的胡萝卜基因,我们构建了275(74.12%)同源基因组的基因树木;这些显示了预期的拓扑,这符合胡萝卜中的两种古单四倍化事件。如预期的那样,一个葡萄基因有四种最佳胡萝卜正交基因,其分为两组,可能是由于两个古同等的重组事件。因此,大量组具有支持两个Paleotetra1Ploidization事件的拓扑额外的文件1数字S5)。

事件相关的基因组同源性

基因组间比较有助于揭示胡萝卜基因组的结构复杂性。从物种和多倍体事件中鉴定出直晶和副酰基基因。关于从Dotplots获得的正交和旁旁区的详细信息额外的文件2表S3和S4)用于定位正交和旁旁基因(附加文件2:表S5-7)。该分析有助于将基因组中的重复基因分离为两个与ech相关的平行基因:Dc-β相关的平行基因和Dc-α相关的平行基因。在86个共线区产生2424对副亲本,包含3866个基因。在咖啡中发现了1640个副同源基因,其中2768个基因分布在92个共线区域。胡萝卜共线区共有5511个副亲缘基因,6777个基因。两个特殊的古四倍体化事件在胡萝卜中产生了更多的副二倍体区,是葡萄的两倍多。理论上,不考虑损失,它应该是葡萄的四倍。值得注意的是,基因数量的减少比预期的更显著。与ech相关的胡萝卜基因(658个)比葡萄(3866个)和咖啡(2050个)少得多,这很可能是由于额外的两次古四倍体化事件后,胡萝卜基因组的不稳定性造成的表格1).

表1与ECH,DC-β和DC-α相关的选定基因组内的重复基因数量

正如预期的那样,基因共线性表明基因组间的同源性优于基因组内的同源性。例如,10907个(35.48%)胡萝卜基因与咖啡同源,5480个(17.83%)咖啡同源,9096个(29.59%)胡萝卜基因与葡萄同源,4324个(14.07%)葡萄同源。类似的结果出现在葡萄和咖啡的对齐中,其他信息可以在附加文件中找到2表S5-7。

多个基因组对齐

利用葡萄基因组作为参考,并将共线基因id填充到一个表中,我们构建了分层和事件相关的多基因组比对,产生了同源基因表[14.]额外的文件1数字S5,附加文件3.:表S8)。该同源共线表用于存储基因组间和基因组内的同源信息,并反映三个多倍体事件和所有显著物种形成。为了适应胡萝卜特有的基因,特别是葡萄基因组中没有的基因或上述比对表中没有代表的基因,我们还构建了一个以咖啡为参考的基因组同源表额外的文件1数字S6,附加的文件3.:表S9),它支持胡萝卜中的古学四倍化证据,并且更好地代表胡萝卜基因共同性。

多倍体事件的进化年代测定

通过计算葡萄,咖啡和胡萝卜中的同义核苷酸位点的同义替换(KS),我们已经成功地估计了顺序古同步翻透事件DC-β,DC-α和其他关键事件的时间。不同的多倍化事件产生的副病毒性可能会重叠分布,但具有长尾的异常,特别是在大值站点中,所以我们采用了一种有效的方法来找到所观察到的KS分布中的主要正态分布(有关更多详细信息,可以看到Wang等人。2018)[19.22].因此,峰值的位置和它们的方差是由统计确定的无花果。1一种额外的文件2表S10)。不同基因组分析得出的ech相关的Ks峰有很大的不同,葡萄的Ks峰为1.053(+/−0.120),咖啡的Ks峰为1.400(+/−0.070),胡萝卜的Ks峰为1.390(+/−0.099),生菜的Ks峰为1.486(+/−0.060)。由此可见,葡萄的进化速度最慢,咖啡、胡萝卜和生菜的进化速度分别比葡萄快32.95、32.00和41.12%。

进化率的显着差异导致在推断进化事件的发生时间时导致扭曲。在这里,基于我们之前开发的方法的改进版本[15.2324252627[我们通过将ex事件的峰对准到同一位置来执行进化速率校正(有关详细信息,请参阅方法)无花果。1B.额外的文件2表S11)。这一校正将ECH峰排列到同一位置,表明它可以校正胡萝卜和葡萄在ECH事件后积累的速率差异。假设ECH事件发生在~ 115-130 Mya [13.28],采用以前的出版物[14.2930.[我们推断DC-β和DC-α事件分别发生〜77-87 mya和〜46-52 mya。同时,我们发现在从纬度(生菜)〜98-111 mya中,在亚藻(代表性基因组胡萝卜)谱系中发生DC-β[4.]并且还有可能在APIALES-BRUNIALES发散后〜86.8 mya [4.],可能在建立Apiales植物中发挥重要作用。

同源基因Dotpotting提供了进一步的证据,即DC-β在Apiales谱系中,但不在群体血管上。比较葡萄和莴苣基因组,我们发现葡萄基因(或染色体区域)具有三种最佳匹配的生菜基因(染色体区)额外的文件1数字S7)。这表明在ECH之后发生全基因组三次,而不是全基因组重复事件,包括生菜的群体的基础基因组。通过构建同源基因偶像仪额外的文件1数字S8),我们发现一个莴苣染色体区域有4个最匹配(或同源)的胡萝卜染色体区域和8个常比同源的染色体区域;一个胡萝卜染色体区域有三个最佳匹配(或同源)莴苣区域和六个外源区域。这支持胡萝卜谱系中的两个四倍体化事件和莴苣谱系中的一个六倍体化事件。

基因分离

在胡萝卜的基因组重复后发生了大量基因损失和易位。胡萝卜中的肿瘤内基因共同分析表明,微小的分数(0.1%,25个区域)保留了八份重复级,可能由三种递归多倍体事件产生,如果保留完美的基因共同性,则应存在于12份(附加文件2表S12)。以葡萄作为参考的基因组间分析显示,0.3%(63)的副本保存在胡萝卜重复区域(附加文件2表向)。然后我们计算每个参考染色体的基因保留率或去除率无花果。4.-5.额外的文件1: 数字。S9)。葡萄和咖啡作为参考既显示出与胡萝卜的较低的共线基因对应。不同的葡萄染色体在它们的四组正交地区中的每一个中具有71-92%的共线基因损失(附加档案2表S14系列)。葡萄2号染色体上大约71、79、86和82%的基因在四组胡萝卜的同源区域中没有共线基因,66%的基因在所有同源区域中没有对应。不同的咖啡染色体在四组同源区域的共线基因丢失率为54-89%(附加文件2表S15)。同样,咖啡8号染色体上的78、86、71和83%的基因在四组胡萝卜的同源区域中没有共线基因,61%的基因在所有同源区域中没有对应。在两组相同的多倍体副产区之间,不同的葡萄(咖啡)染色体的基因损失率并不都相似0-0.1(0-0.29)。大体上,这些发现表明在多倍体化事件后广泛的基因缺失或重新定位。

图4
装具

沿着相应的正非葡萄染色体的同源对准和胡萝卜群基因保持。基因组常规和基因组内的局部信息显示在五个圆圈中。形成最内桶军医染色体圆圈的短线代表了预测基因。桶军医和葡萄吡咯染色体区域中的每一个在胡萝卜中具有四个正交副本。每个圆圈由短垂直线形成,所述垂直线表示同源基因,其着色以指示其各自的源设备中的染色体数,如底部的颜色方案所示。一种胡萝卜同源区1组(红色)和同源区2组(黑色)滑动窗口基因保留率;B.胡萝卜同源区3组(绿色)和同源区4组(蓝色)滑动窗口基因保留率;C第1组和第2组(橘黄色)和第3组和第4组(青柠色)之间的差异被显示出来。大块的染色体节段性缺失(黄色)

图5
figure5

胡萝卜基因组与葡萄基因组的局部比对作为参考。从图中的全局对齐中选择一小段对齐的细节。4..同源块系统发育(左):葡萄基因组中的三个副同源染色体片段:grape -10、grape -12和grape -19,来自受ECH影响的祖先染色体,每一个都有四个同源胡萝卜染色体片段。基因以矩形表示。相邻的染色体区域之间的同源基因以株系连接

为了探讨基因组分级的潜在机制,与其他引用的基因组相比,在胡萝卜中表征在胡萝卜中的持续去除[31(方法Wang et al. 2015a)。尽管有一些染色体片段被移除(可能是片段丢失)额外的文件1数字。S5和S6),大多数基因缺失是15个持续基因或更少。统计健身回归显示近几何分布后的删除模式额外的文件1数字S10,附加的文件2:表S16)。用葡萄和咖啡基因组作为参考文献,红萝萝萝卜在几何分布之后的基因去除模式(几何参数P. = 0.221–0.249, the probability of removing one gene at a time, and goodness ofP.-value = 0.93)。这表明,38-42%的基因在包含1或2个基因的运行中被移除,表明一种短DNA片段的分离机制,或大约5-10 kb的DNA长度。似乎短期的删除运行占了最初的大多数,然后递归删除重叠之前的运行延长了观察到的运行长度。

此外,我们以100个基因和一个基因的步骤作为滑动窗口计算保留水平额外的文件4.表肌力表现)。Dc-α产生的同源区域被归为A11-A12和A21-A22亚基因组(A表示推断的亚基因组);A11-A21、A11-A22、A12-A21、A12-A22与Dc-β相关。以葡萄基因组为参考,Dc-α的A11-A12和A21-A22的同源滑动窗口分别只有25.48和22.01%,差异不显著(基因保留率差异小于5%:P.< 0.05)。同时,对于Dc-β, A11-A21、A11-A22、A12-A21和A12-A22的同源滑动窗分别只有22.01、27.41、25.87和19.69%,基因去除无显著差异(p < 0.05)。通常,由两个重复事件产生的亚基因组之间的差异基因保留率表明Dc-α和Dc-β可能具有异源四倍体化性质。为了进一步确定,我们使用咖啡作为参考基因组来计算保留率,并发现了更有力的证据额外的文件4.表S18)。对于DC-α,对于A11-A12和A21-A22,仅存在82.6和90.36%的同源滑动窗口,显示出基因损失的显着差异(P <0.05)。对于DC-β,只有76.89-81.7%的同源滑动窗,在基因保留中显示出显着差异(P <0.05)。这些发现支持两个事件的假设异步方式。

以葡萄为参照,我们根据同源比对表(图。6..根据基因共线性的交替侵蚀,胡萝卜基因损失可分为三类:1、胡萝卜基因损失Dc-β之前;2、胡萝卜Dc-β和Dc-α基因缺失;3、Dc-α后胡萝卜基因丢失。我们推测,胡萝卜基因在Dc-β发生前、Dc-β和Dc-α发生之间和Dc-α发生后分别丢失了1330、5594和6312个基因。这一推断表明,在最近的两次多倍体化事件后,广泛分布的基因丢失了,而在这两次事件之前,祖先的基因组相对稳定。显然,这三个时期中不同的基因丢失率可能受到两次额外的多倍体化的影响,这支持了多倍体化轮数更多的物种可能遭受更多的基因丢失的观点。Dc-α和Dc-β的基因丢失率分别为84%和86% - 87%,多倍化后基因丢失量较大;这类似于棉花基因组在十倍体化后发生的近70%的基因损失和现有大豆中大约69%的基因损失,这也受到ECH后两个额外的四倍体化事件的影响[15.25].

图6
figure6

不同进化时期胡萝卜基因丢失的检测。”?代表了可能存在的一种基因。a基因系统发育:如果没有发生基因丢失,一个葡萄基因预计有四个胡萝卜同源基因,Dc11, Dc12, Dc21和Dc22。两个胡萝卜的古四倍体化事件被闪电记录下来。b矩形表示基因;‘×’表示基因丢失;胡萝卜基因丢失的可选情况分为三类:DC-β之前的胡萝卜基因丧失;胡萝卜Dc-β和Dc-α基因缺失Dc-α后胡萝卜基因丢失

在本研究中,我们在葡萄或咖啡中发现了与两个或多个同源基因相对应的重复DNA片段的基因。我们在32,113个胡萝卜基因中发现了9114个在其形成过程中存在重复片段。例如基因DCAR_003216(重复片段最多的17个)的序列是两个葡萄串联基因Vv13g1246和Vv13g1253的融合。DCAR_003216基因的序列几乎是咖啡基因Cf02_g28080的两倍。上述观察结果可以用葡萄中保存了两个古老的串联基因来解释:它们在胡萝卜中融合,在咖啡中丢失了一个串联基因副本。

多倍化和类胡萝卜素途径基因

总共有三种鉴定的红萝卜多倍化事件(ECH,DC-β和DC-α事件),它们有助于扩增MEP途径。在这里,我们通过BLASTP(E-VALUE <1E-10和得分> 150)检测到胡萝卜,葡萄和咖啡中的MEP和类胡萝卜素途径中的基因同源物无花果。7.额外的文件2表S19),使用之前报道的途径中的基因作为搜索种子[11.].在胡萝卜的MEP和类胡萝卜素途径中,28%的基​​因与ECH事件有关,而96和92%分别与DC-β和DC-α有关。与MEP途径相比(仅4-(胞嘧啶5-磷酸)-2-C-甲基-D-Irithritol激酶(CMK)和4-(胞苷5-磷酸)-2-C-甲基-D-Irithritol激酶(MTS)had the same copy number in carrot, grape, and coffee genomes), the number of gene copies in the carotenoid pathway (15-cis-phytoene desaturase (PDS), ζ-carotene isomerase (Z-ISO), carotenoid isomerase (CRTISO), ζ-carotene desaturase (ZDS), lycopene ε-cyclase (LCYE) and violaxanthin de-epoxidase (VDE) had the same copy number in carrot, grape, and coffee genomes) is relatively stable. The gene with the highest copy number in carrot, grape, and coffee is the carotenoid cleavage dioxygenase (CCD) gene with 17, 14, and 9 copies, respectively, and the second is the 9-cis-epoxycarotenoid dioxygenase (NCED) gene (15, 11, 6 copies, respectively). Although both CCD and NCED play a negative role (also having geranyl diphosphate synthase (GPPS) and beta-carotene hydroxylase (BCH)) in carotenoid biosynthesis, the copy numbers of the genes 2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase (MCT), 4-hydroxy-3-methylbut-2-en-1-yl diphosphate synthase (HDS), geranylgeranyl pyrophosphate synthase (GGPPS), 4-hydroxy-3-methylbut-2-enyl diphosphate reductase (HDR) and isopentenyl-diphosphate delta-isomerase I-like (IPPI) increased in carrot slightly; this led to the increase in carotene pathway precursor, which might be the key factors contributing to the increase in carotene content in carrots. The carotenoid pathway is relatively conservative in the three species, with the same number of copies, except for the BCH, cytochrome P450 97B3 and CHXE genes. The copy numbers of CYP97B3 and CHXE, which control the degradation of α-carotene, decreased, and BCH, which regulates degradation of β-carotene, increased in carrots; this may be a reason for why the levels of α-carotene are 10 times higher than those of β-carotene in carrot.

图7
figure7

MEP和类胡萝卜素途径。括号中的数字依次表示胡萝卜(黑色)、葡萄(紫色)和咖啡(绿色)中的基因。红色和蓝色箭头表示与葡萄和咖啡相比,胡萝卜的复制数增加或减少

讨论

DC-β代替三次的四倍化

由于递归多倍体化和基因组重模式事件,植物基因组通常具有复杂的结构[3233],这增加了解营抑制基因组结构的难度,了解基因组形成,或探索基因,基因家族和途径的起源和功能演化。在回合多倍化之后破译基因组结构的关键考虑是在基因组间比较中从外旁的水分块区分开。基因偶像仪可用于实现这种区别,以前用于推断三轮古多倍数拟南芥蒂利亚纳[12.].这种比较基因组学流水线已经被有效地应用于一些植物物种或群体的基因组结构分析,如棉花[15.,榴莲22],栽培花生[34),豆类(25]和葫芦科[19.].事实上,之前的一项研究基于对同位基因块(一个葡萄区域有6个胡萝卜块)的分析推断出了WGT (Dc-β)和WGD (Dc-α) [11.],这可能会混合出直际和临床。如图所示,当使用葡萄和咖啡作为参考基因组时,胡萝卜基因组的分析显示为1:4的关系,将胡萝卜副联合区域分成两组。1:4的比率表明DC-β事件是四倍化而不是三倍,而不是预先报告的[11.].每个多倍化和/或物种事件推断出直级和旁透基基因名单,将构成在未来研究中使用的APIALES比较基因组学平台。

此外,大约74.12%(371 in 371)的同源基因拓扑树木支持胡萝卜中的两种古单型翻倍,这是有力的证据。关于草常见的四倍化事件,31-37%的同源基因拓扑树木[7.10.]和38.9%(175年)的同源基因拓扑树木支持葫芦属常见的四倍化[19.].不符合期望的其他同源基因拓扑树木可能是由递归复制基因的发散进化率引起的。

Dc-α和Dc -β都可能是异源四倍体化

古代WGD在植物适应方面发挥了重要作用,使白垩纪 - 古(K-PG)边界,多倍体贡献了更多与黑暗和冷应力相关的基因家族[35].具有不平衡亚因子的多倍体(被视为Allopolyploids)建立了主要植物群,如玉米报告的[36,面包小麦[37],芸苔[38葫芦科植物物种[19.].异源多倍体有很长的时间跨度,其中一些发生了数千年,比如油菜和面包小麦,而另一些发生在玉米和葫芦科中则有数千万年。胡萝卜的连续异源多倍体可能提供遗传和环境优势,提高存活率。

胡萝卜的古四倍体化范围

通过共线基因块分析,推测Dc-β和Dc-α多倍体事件分别发生在~ 77-87和~ 46-52 Mya。Dc-β的发生时间似乎接近胡萝卜和生菜的分化时间,据文献报道,这两个分化时间分别为~ 72和93 Mya [4.11.].通过Conlinear Ortholog分析,我们估计红萝卜生菜发生发生98-111 mya,表明胡萝卜和生菜不共享四倍化事件。此外,胡萝卜和生菜的同源偶像表明,两种基因组中的同源区域的比例为4:3(附加文件1图S8),意味着生菜谱系中的全基因组三倍。总之,通过此处呈现的分析,我们证明了两个四倍化事件特异于Apiales,并且可能导致植物谱系的形成。

富含类胡萝卜素的胡萝卜的可能因素

多倍体化一直有助于关键性状的进化,如结瘤、NBS-LRR抗性、EIN3/EIL、棉纤维、VC生物合成和循环相关基因[2530.3940].基于Iorizzo等人提出的MEP和类胡萝卜素途径[11.[我们分析了MEP和类胡萝卜素途径中调节基因与不同多倍化事件之间的关联。我们发现每个多倍体事件差别影响类胡萝卜素累积途径。DC-β和DC-α事件在胡萝卜中贡献了多于呼应事件,可能是因为最近发生了DC-β和DC-α事件,这可能促进了胡萝卜的形成。水平比较胡萝卜,葡萄和咖啡中基因拷贝数的变化,一些基因在三种物种中具有相同的拷贝数。有趣的是,与其他参考基因相比,胡萝卜基因组的CCD和Ncce基因的拷贝数,与类胡萝卜素劣化有关的基因,这与胡萝卜具有富含类胡萝卜素含量的事实相矛盾。MCT,HDS,HDR,IPPI和GGPPS基因的增加可能是实际类胡萝卜素的胡萝卜的关键因素。

进化率

不同物种中进化率的差异影响了系统发育分析和准确时间估计。例如,棉花的发展速度比榴莲快64%[22],咖啡基因组比Kiwifruit和葡萄基因组快47.20%[39,桑树的进化速度(甚至是其他罗萨莱斯物种的3倍)快得多[41].在这里,我们发现葡萄的进化速度最慢,而咖啡、胡萝卜和生菜的进化速度分别比葡萄快32.95、32.00和41.12%。为了进行真实的年代测定,咖啡和胡萝卜的进化速度被用进化速度最慢的葡萄修正。

结论

根据该研究,同源性的分层推理揭示了成形胡萝卜基因组的两种四倍化事件;这些事件可能导致成功建立Apiales植物和类动物骨覆盖途径上游的MEP途径基因的扩张。

方法

基因组序列和注释从相应的基因组计划网站下载额外的文件2表:20)。

基因共线性

共线基因是通过colineearscan算法和软件推断出来的[20.].基因间最大共线性间隔长度设为50个基因,如前所述[17.232425].使用MCSCANX工具包生成一个基因组内或不同基因组之间的同源基因点图[42].

事件相关共线基因表的构建

以葡萄基因为参考,构建了多倍体事件相关共线基因表(附加文件)3.表S8)。第一列是所有的葡萄基因,排列在染色体上的位置。每个葡萄基因可能有两个额外的ECH共线基因,所以葡萄基因填充了其他两列。对于咖啡基因组,除了ECH之外没有额外的重复,我们在葡萄基因组后面分配了一列。对于胡萝卜基因组,由于有两个古四倍体化事件,我们在咖啡柱后面分配了四列。因此,表中有18列,反映了不同多倍体事件后物种间的同源关系。对于葡萄基因,当在预期位置有相应共线基因时,将基因ID填充到表中相应列的单元格中。当它丢失时,通常是由于基因组中的基因丢失或易位,我们在细胞中填充一个点。咖啡引用表的构造与此类似(附加文件3.:表S9)。

进化树建筑与同源线桌

一个葡萄基因有三个或更多的同源胡萝卜基因,这些同源胡萝卜基因是用最大似然法在PHYML中构建的进化树[43],以及默认参数设置下PHYLIP的邻居连接方法[44].

核苷酸替代

同义核苷酸替换(KS.)之间的同源基因通过运行BioPerl(版本:1.007002)生物统计学包,Bio::SeqIO, Bio::Align::Utilities, Bio::Seq::EncodedSeq, Bio::AlignIO和Bio::Align::DNAStatistics进行估计,该包实现了Nei-Gojobori方法[45].

进化约会校正

为了纠正ech产生重复基因的进化速率,最大似然估计μ从推断的KS ech-产生的重复基因对准,与葡萄的值相同,这已经进化了最慢的。假设葡萄复制基因对与ks值是随机可变分布是xG~(μG那 σG2)并且对于另一个基因组中的重复基因对,Ks分布是x一世~(μ一世那 σ一世2);我们在随机变量中获得了对以下等式的相对差异的期望:

$ $ \ mathrm {r} = \离开({\μ}_ {\ mathrm{我}}-{\μ}_G \右)/{\μ}_G。$$

得到修正的X我−校正~(μ我−校正那 σ我校正2),则定义修正系数为:

$ $ \压裂{\ mu_ {\ mathrm{我}- \ mathrm{校正}}}{\ mu_i} = \压裂{\ mu_ {\ mathrm {G}}} {\ mu_i} ={\λ}_i $ $

\({\μ}_ {\ mathrm{我}- \ mathrm{校正}}= \压裂{\ mu_ {\ mathrm {G}}} {\ mu_i} \ *{\μ}_i = \压裂{1}{1 + r}{\μ}_i \ \倍)

$ ${\λ}_i = \压裂{1}{1 + r} $ $

然后,

$$ {\ mathrm {x}} _ {\ mathrm {i} - \ mathrm {校正}} \ sim \ left({\ lambda} _ {\ mathrm {i}} {\ mathda _i,{\ lambda}_ {\ mathrm {i}} {\ sigma_i} ^ 2 \右)。$$

为了计算两种植物间同源基因对的k值,一世j假设k分布是Xij= (μij那 σij2);我们采用两种植物的校正系数的代数平均值,

$$ {\ lambda} _ {\ mathrm {i} \ mathrm {j}} =左({\ lambda} _ {\ mathrm {i}} + {\ lambda} _ {\ mathrm {j}} \)/ 2,$$

然后,

$$ {x} _ {i-校正} \ sim \ left({\ lambda} _ {ij} {\ mu} _ {ij},{\ lambda} _ {ij} {\ sigma_ {ij}} ^ 2\对)。$$

具体来说,当一株植物是葡萄时,对另一株来说,一世,我们有

$ $ {X} _ {iG -校正}\ sim \离开({\λ}_i{\μ}_ {iG},{\λ}_i {\ sigma_ {iG}} ^ 2 \右)。$$

数据和材料的可用性

目前在目前的研究中分析的数据最初从JGI下载(https:////phytozome.jgi.doe.gov/),http://coffee-genome.org/.本研究过程中产生或分析的所有数据和资料均包含在本文中,或应相应作者的合理要求提供。

缩写

ech:

核心Eudicot-Common六倍性

米娅:

几百万年前

参考

  1. 1。

    Seddon JM, Ajani UA, Sperduto RD, Hiller R, Blair N, Burton TC, Farber MD, Gragoudas ES, Haller J, Miller DT,等。膳食类胡萝卜素、维生素a、C和E与老年性黄斑变性眼病病例-对照研究组《美国医学协会杂志》上。272(18): 1413 - 1994; 20。

    中科院PubMed文章公共医学中心谷歌学者

  2. 2.

    弗雷泽警局,布莱姆利首相。类胡萝卜素的生物合成和营养用途。中华内分泌杂志2004;43(3):228-65。

    中科院PubMed文章公共医学中心谷歌学者

  3. 3.

    RUBATZKY VEQ, SIMON CF, RUBATZKY PW, VEY m。瓦林福德:CABI出版社;1999.

  4. 4.

    一种元校正的时间树记录了开花植物系统发育多样性的早期上升。新植醇。2015;207(2):437 - 53年。

    PubMed文章公共医学中心谷歌学者

  5. 5.

    没有任何。开花植物订单和家庭的Ageniosperm Phylogey组分类的更新:APG IV。Bot J Linnean Soc。2016; 181(1):1-20。

    文章谷歌学者

  6. 6.

    Van de Peer Y.揭开了一个谜团。基因组医学杂志。2011;12(5):113。

    PubMed公共医学中心文章谷歌学者

  7. 7.

    帕特森啊,鲍德·杰,查普曼班。谷物古代多倍化谷物的分歧及其对比较基因组学的后果。Proc Natl Acad Sci U S A. 2004; 101(26):9903-8。

    中科院PubMed公共医学中心文章谷歌学者

  8. 8.

    Soltis de,Bell CD,Kim S,Soltis PS。Agenperms的起源和早期演变。Ann N Y ACAD SCI。2008; 1133:3-25。

    中科院PubMed文章公共医学中心谷歌学者

  9. 9.

    Kashkush K,Feldman M,Levy AA。新合成小麦同种异体四倍体中的基因损失,沉默和活化。遗传。2002; 160(4):1651-9。

    中科院谷歌学者

  10. 10。

    Jiao Y, Wickett NJ, Ayyampalayam S, Chanderbali AS, Landherr L, Ralph PE, Tomsho LP, Hu Y, Liang H, Soltis PS, et al.;种子植物和被子植物的祖先多倍体。Nat。2011;473(7345):97 - 100。

    中科院文章谷歌学者

  11. 11.

    Iorizzo M,Ellison S,Senalik D,Zeng P,Satapoomin P,Huang J,Bowman M,Iogene M,Sanseverino W,Cavagnaro P等人。高质量的胡萝卜基因组组件为类胡萝卜素积累和分子基因组进化提供了新的见解。NAT Genet。2016; 48(6):657-66。

    中科院PubMed文章公共医学中心谷歌学者

  12. 12.

    贾荣杰,贾荣杰,贾荣杰。通过染色体复制事件的系统发育分析揭示被子植物基因组进化。Nat。2003;422(6930):433 - 8。

    中科院文章谷歌学者

  13. 13.

    焦y,李贝斯 - 麦克J,Ayyampalayam S,Bowers Je,Mckain Mr,McNeal J,Rolf M,Ruzicka Dr,Wafula E,Wikeett NJ,等。与核心销售早期多样化相关的基因组三倍。基因组Biol。2012; 13(1):R3。

    PubMed公共医学中心文章谷歌学者

  14. 14.

    Jaillon O, Aury JM, Noel B, Policriti A, Clepet C, Casagrande A, Choisne N, Aubourg S, Vitulo N, Jubin C, et al.;葡萄基因组序列表明主要被子植物门的祖先六倍体化。Nat。2007;449(7161):463 - 7。

    中科院文章谷歌学者

  15. 15.

    王旭,郭华,王军,雷涛,刘涛,王志强,李永华,李俊,唐华,等。比较基因组反褶曲的棉花基因组揭示了一个十二倍体祖先和广泛的染色体分裂。新植醇。2016;209(3):1252 - 63。

    中科院PubMed文章公共医学中心谷歌学者

  16. 16.

    李Z,Baniaga AE,Sessa EB,Scascitelli M,Graham SW,Rieseberg LH,Barker Ms。针叶树和其他种子植物的早期基因组重复。SCI ADV。2015; 1(10):E1501084。

    PubMed公共医学中心文章谷歌学者

  17. 17.

    王X,Shi X,Hao B,Ge S,Luo J.稻米基因组中的复制和DNA节段性损失:对倍增的影响。新植物。2005; 165(3):937-46。

    中科院PubMed文章公共医学中心谷歌学者

  18. 18.

    谷粒基因组的古老复制。新植醇。2005;165(3):658 - 61。

    中科院PubMed文章公共医学中心谷歌学者

  19. 19.

    王j,sun p,li y,liu y,yang n,yu j,ma x,sun s,xia r,liu x等。在葫芦科在葫芦科忽略了忽略的古单左撇子化。mol Biol Evol。2018; 35(1):16-26。

    中科院PubMed文章公共医学中心谷歌学者

  20. 20。

    关键词:拟南芥,染色体同源性,基因共线性,统计推断,水稻BMC Bioinform。2006;7:447。

    文章中科院谷歌学者

  21. 21。

    基于遗传算法的真核生物基因组复制与基因复制研究。中国科学院院刊2005;102(15):5454-9。

    中科院PubMed公共医学中心文章谷歌学者

  22. 22。

    Wang J, Yuan J, Yu J,孟F, Sun P, Li Y, Yang N, Wang Z, Pan Y, Ge W, et al. .递归的古六倍体化塑造了榴莲基因组。植物杂志。2019;179(1):209 - 19所示。

    中科院PubMed文章公共医学中心谷歌学者

  23. 23。

    王旭,金东,王震,郭华,张磊,王磊,李俊,Paterson AH。在真核生物的进化过程中,以端粒为中心的基因组重模式决定了染色体数目的重复减少。新植醇。2015;205(1):378 - 89。

    中科院PubMed文章公共医学中心谷歌学者

  24. 24。

    王j,yu j,sun p,li y,x ri,liu y,ma x,yu j,yang n,lei t等。水稻和菠萝的比较基因组学分析有助于了解草地上的染色体数量和基因组变化。前群体。2016; 7:174。

    PubMed公共医学中心谷歌学者

  25. 25.

    王军,孙鹏,李艳,刘艳,马旭,孙胜,杨宁,夏锐,雷涛,等。豆科植物基因组的分层排列建立了一个家庭水平的基因组平台。植物杂志。2017;174(1):284 - 300。

    中科院PubMed公共医学中心文章谷歌学者

  26. 26.

    刘y,王继,葛,王z,李y,杨n,太阳s,张l,王x。两个高度相似的白杨古亚群提出了Salicaceae植物的自身传递一包祖先。前植物SCI。2017; 8:571。

    PubMed公共医学中心谷歌学者

  27. 27.

    孙胜,王建军,于建军,夏锐,王磊,王铮,葛伟,刘旭,李勇,等。对普通小麦和其他禾草基因组进行比对,建立了比较基因组学研究平台。植物学报,2017;

    PubMed公共医学中心文章谷歌学者

  28. 28.

    Vekemans D,Proost S,Vanneste K,Coenen H,Viaene T,Ruelens P,Maere S,Van de Peer Y,Game K.Game PaleohexaLoidy在核心销售的茎谱系中:对疯子箱基因和物种多样化的重要性。mol Biol Evol。2012; 29(12):3793-806。

    中科院PubMed文章公共医学中心谷歌学者

  29. 29.

    马铃薯基因组测序,徐晓春,潘胜,程胜,张斌,穆东,倪鹏,张刚,杨胜,李锐,等。块茎作物马铃薯的基因组序列分析。Nat。2011;475(7355):189 - 95。

    文章中科院谷歌学者

  30. 30.

    Paterson AH, Wendel JF, Gundlach H, Guo H, Jenkins J, Jin D, Llewellyn D, Showmaker KC, Shu S, Udall J,等。棉基因组的重复多倍体化与可纺棉纤维的进化。Nat。2012;492(7429):423 - 7。

    中科院文章谷歌学者

  31. 31。

    王旭,王静,金东,郭华,李涛,刘涛,Paterson AH。跨越主要禾本科谱系的基因组比对揭示了异质性的进化速率和变化推断的关键进化事件的日期。摩尔。2015;8(6):885 - 98。

    中科院PubMed文章公共医学中心谷歌学者

  32. 32。

    道格拉斯e,soltis cjv,soltis ps。然后多倍体革命......现在:重新审视斯堡。我是J机器人。2014; 101(7):21。

    谷歌学者

  33. 33。

    植物的多倍体和基因组进化。电子学报。2015;35(2):119-25。

    中科院PubMed文章公共医学中心谷歌学者

  34. 34。

    庄伟,陈辉,杨敏,王静,潘迪MK,张超,常卫文,张磊,张旭,唐锐,等。栽培花生的基因组为了解豆科植物的核型、多倍体进化和作物驯化提供了依据。51 Nat麝猫。2019;(5):865 - 76。

    中科院PubMed文章公共医学中心谷歌学者

  35. 35。

    吴树华,韩斌,焦勇。古多倍体对被子植物适应性进化的遗传贡献。摩尔。2019。

  36. 36。

    玉米亚基因组分化的基因组优势和古老和持续的基因丢失。中国科学院院刊2011;108(10):4069-74。

    中科院PubMed公共医学中心文章谷歌学者

  37. 37.

    国际小麦基因组测序C.六倍体面包小麦的染色体曲目序列小麦基因组。SCI。2014; 345(6194):1251788。

    文章中科院谷歌学者

  38. 38.

    王旭,王浩,王健,孙锐,吴军,刘胜,白勇,文建华,Bancroft I,程飞,等。中多倍体作物油菜的基因组。Nat麝猫。2011;43(10):1035 - 9。

    中科院文章谷歌学者

  39. 39.

    王吉,俞jg,李俊,孙电脑,王l,元jq,萌fb,孙力SR,李yx,雷泰等。两种可能的自动四倍化事件形状为猕猴桃基因组,有助于建立Actinideae家族。荒谬。2018; 7:230-40。

    PubMed公共医学中心文章谷歌学者

  40. 40.

    Li M,Wang R,梁Z,Wu X,Wang J.Allotetraplid Brassica Napus中EIN3 / EIL基因家族的基因组鉴定和分析揭示了多倍化过程中的潜在优势。BMC植物BIOL。2019; 19(1):110。

    PubMed公共医学中心文章谷歌学者

  41. 41.

    他n,张c,qi x,zh s,陶义,杨g,李th,王x,cai q,li d等。桑树森树的基因组序列草案。NAT Communce。2013; 4:2445。

    PubMed公共医学中心文章中科院谷歌学者

  42. 42。

    Wang Y, Tang H, Debarry JD, Tan X, Li J, Wang X, Lee T, Jin H, Marler B, Guo H. MCScanX:一种用于基因共线性和共线性检测的工具箱。核酸学报2012;40(7):e49。

    中科院PubMed公共医学中心文章谷歌学者

  43. 43。

    PHYML Online——一个基于快速最大可能性的系统发育推断的web服务器。核酸Res. 2005;33(Web服务器问题):W557-9。

    中科院PubMed公共医学中心文章谷歌学者

  44. 44。

    卡明斯麦克风。Phylip(系统发生推理包);2004年。

    谷歌学者

  45. 45。

    Nei M,Gojobori T.估计同义词和非纯核苷酸取代数的简单方法。mol Biol Evol。1986; 3(5):418-26。

    中科院PubMed公共医学中心谷歌学者

下载参考

确认

我们感谢与中国Igeno Co. Ltd.的研究人员有用的讨论。

资金

国家自然科学基金项目(No. 31371282, No. 31510333, No. 31661143009);河北省国家自然科学基金项目(No. 31661143009)唐山市重点实验室。资助方没有在研究的设计、收集、分析和解释相关数据以及撰写手稿中发挥任何作用。

作者信息

隶属关系

作者

贡献

XW构思并领导了这项研究。JW和JY实施和协调分析。JY, YLi, CW, HG和JZ进行了分析。YLiu和JZ对系统发育分析和图像处理做出了贡献。XL对手稿进行了有益的讨论和修改。JW和JY撰写了论文。XW和JW对手稿进行了修改。所有作者阅读并批准了最终的手稿。

通讯作者

对应到Xiyin Wang.

道德声明

伦理批准和同意参与

不适用。

同意出版物

不适用。

利益争夺

两位作者宣称他们没有相互竞争的利益。

额外的信息

出版商的注意

Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。

补充信息

附加文件1:图S1。

在胡萝卜基因组中的同源dotplot。图S2。葡萄和胡萝卜基因组的同源点图。图S3。咖啡和胡萝卜基因组的同源点图。图S4。胡萝卜和咖啡之间同源基因点图的例子。图S5。具有支持DC-α和DC-β.A-F的拓扑的树木。图S6。胡萝卜、咖啡和葡萄的基因组比对。图S7。葡萄与莴苣的同源点图。图S8。胡萝卜和生菜之间的同源dotplot。图S9。沿着相应的同源咖啡染色体同源排列和胡萝卜亚基因组基因保留。细节图。4.图S10。在胡萝卜和咖啡中拟合一个几何分布和基因损失率。

附加文件2:表S1。

基因组或基因组内的同源块和基因对的数量。表S2。基因组或基因组内的同源基因的数量。表S3。葡萄和胡萝卜之间的同源基因组区域。表S4。咖啡和胡萝卜之间的同源基因组区域。表S5 S6。S7。一个基因组内或基因组之间的邻同源、同源和外同源基因对。表S10。与每个基因组内和基因组间重复事件相关的Ks分布的核函数分析(进化速率校正前)表S11。ks分布与每个基因组内的重复事件和基因组(进化率校正后的核函数分析。表S12。胡萝卜、咖啡和葡萄基因组的同源深度。表向。与葡萄或咖啡的甘蓝醛甲克罗特全面的相互核心同源深度作为参考。表S14。与葡萄或咖啡的甘蓝醛甲克罗特全面的相互核心同源深度作为参考。表S15。咖啡的胡萝卜基因损失率和基因易位作为参考基因组。表S16。通过使用不同密度曲线的几何分布曲线观察到基因损失和易位数分布。表S19。类胡萝卜素积累基因家族。表S20。基因组数据的信息。

附加文件3:表S8。

红萝卜与葡萄作为参考的同源对齐。表S9。以咖啡为参照的胡萝卜基因组同源比对。

附加文件4:表S17。

葡萄基因组中同源胡萝卜区域的基因保留。S18表美国。植物基因组亚基因组保留指数的结果。

权利和权限

开放访问本文根据创意公约署署署的条款分发了4.0国际许可证(http://creativecommons.org/licenses/by/4.0/),它允许在任何媒体上无限制地使用、分发和复制,前提是你给予原作者和来源适当的荣誉,提供一个到知识共享许可协议的链接,并指出是否作出了更改。创作共用及公共领域专用豁免书(http://creativecommons.org/publicdomain/zero/1.0/)除非另有说明,否则适用于本文中提供的数据。

再版和权限

关于这篇文章

通过CrossMark验证货币和真实性

引用这篇文章

王,J.,Yu,J.,Li,Y.et al。顺序古四重翻转形状的胡萝卜基因组。BMC植物杂志20,52(2020)。https://doi.org/10.1186/s12870-020-2235-7

下载引用

关键字

  • 胡萝卜
  • 咖啡
  • 生菜
  • 类胡萝卜素
  • 基因共线性
  • 基因分离
  • 多倍化