跳到主要内容

红花柱头的EST数据库

摘要

背景

藏红花(番红花sativusL.,Iridaceae)从希腊语 - 米诺文明以来,紫薇)花被用作香料和药用植物。可食用的部分 - 柱头 - 通常被认为是世界上最昂贵的香料,并且是特殊的二级新陈代谢的部位,负责藏红花的特征颜色和味道。

结果

我们从藏红花柱塞cDNA文库生产了6,603个高质量的表达序列标签(EST)。此集合可通过以下方式访问和可搜索番红花基因数据库http://www.saffrongenes.org。这些ESTs被分为1893个簇,每个簇对应一个不同的表达基因,并进行了注释。完整的EST原始序列及其电泳图保存在数据库中,使用户可以调查序列质量和EST结构特征(媒介污染、重复区域)。藏红花柱头转录组包含一系列有趣的序列(假定的性别决定基因,脂质和类胡萝卜素代谢酶,转录因子)。

结论

番红花基因数据库代表了鸢尾科的基因组学,柱头生物发生的分子生物学,以及藏红花次生代谢的代谢途径的第一个参考集合。

背景

藏红花(番红花L)是一种三倍体不育植物,可能来自野生物种番红花签字人.它已被繁殖并用作地中海地区的香料和药用植物数千年[1].藏红花的驯化可能发生在公元前3000年至1600年的希腊-米诺斯文明时期。希腊圣托里尼岛出土了一幅描绘藏红花采集者的壁画,其历史可以追溯到公元前1600年。

藏红花通常被认为是世界上最昂贵的香料。如今,主要生产国是伊朗、希腊、西班牙、意大利和印度(克什米尔)。除了商业和历史方面,藏红花的其他几个特点使其成为一个有趣的生物系统:香料来自花的柱头(图)1),其手动收获并进行干燥。番红花,番红豆苷和鳄鱼苷糖苷的主要颜色以及主要味道,PicRocrocin和Safranal源自类胡萝卜素的氧化切割[23.)(图1 b).藏红花属鸢尾科(百合目,单子叶植物),基因组特征不明显,大小相对较大。

图1
图1

藏红花的香料.答:番红花的花。箭头指向柱头,收获后晾干,构成藏红花香料。藏红花的主要颜色(藏红花素)和风味(苦藏红花素和藏红花醛)的生物合成途径(源自[2], 修改的)。

藏红花柱头的转录组特征可能揭示几个重要的生物学现象:香料风味和颜色生物发生的分子基础,雌蕊的生物学和鸢尾科的基因组组织。基于这些原因,我们对藏红花柱头的表达序列标签(ESTs)进行了测序和生物信息学特性分析。

结果与讨论

测序和组装

成熟藏红花柱头lambda Uni-ZAP定向cDNA文库[2斯特拉斯堡大学Bilal Camara教授善意提供。对图书馆进行自动切除,并将CDNA插入切入PCR扩增并从5'末端测序。

使用Phred程序分析9769份电泳图[4].从5'和3'末端除去低质量序列,进一步加工序列以除去载体污染并掩盖低复杂性和/或重复子序列。该过程将原始数据集还原为6,603个高质量序列,超过60个核苷酸。仅考虑将长度大于或等于100个核苷酸的6,202个酯碎片,用于提交NCBI DBEST划分。它们可在EX142501到EX148702的加入号码下访问它们。

EST数据集进行聚类/组装[5,以便对推定来自同一基因的ESTs进行分组,并根据推定的转录本产生暂定一致序列(TC)。生成的集群总数为1893个。每一簇应该对应一个独特的基因,即它代表一个基因索引。1376个簇由单个EST组成,因此被归类为单簇。其余517个簇由5324个est组成,组装成534个TCs(表)1).在11个簇中,对ESTs进行组装,从而定义多个tc(范围从2个到6个)。一个簇中的多个tc具有高度相似的共同区域,这可能是由于可能的替代转录本、同源或域共享。图中报告了数据集中的GC内容分布2.平均GC含量约为44%。

图2.
图2.

GC内容分发.绘制EST的数量符合其GC含量。平均GC含量为44.3%。

表1程序集统计信息

数据库和Web界面

数据集用于构建番红花基因数据库(6].该数据库体系结构由一个主要的MySQL关系数据库和两个卫星数据库myGO和myKEGG组成。使用HTML和PHP脚本创建一个用户友好的web界面。一个预定义的查询系统支持数据检索;实现html树图形显示,浏览酶类和代谢途径。与用户定义的标准相对应的转录本,可以实时地映射到KEGG代谢图上,这些代谢图可以作为GIF图像访问[7].可以下载单个EST的电泳图以重新检查序列质量。

自动化功能注释

为了给每个转录本分配一个初步的功能,使用BLASTX与UniProtKB/Swiss-Prot数据库比较TCs和单例。在1910个转录本中,1158个(60.6%)没有命中,而其余752个(39.4%)在蛋白质数据库中至少有一个显著匹配。在后一组中,131(6.9%)被描述为假设的、未知的或表达的蛋白质,因此不能确定转录产物的有效功能作用。

基因本体论术语自动分配给匹配的UNIPROTKB / SWISS-PROT数据库中的蛋白质的那些157转录物,其登录号出现在卫星数据库MyGo中(参见方法)。在许多情况下,可以将多种基因本体论术语分配给相同的转录物,导致分子函数的210分配,944分配给生物学过程,最后2,192级至细胞组分类。为了展示本体内容的广泛概述,整个本体集合都被映射到工厂GO SLIMS术语上。在分子函数本体类别中,最代表性的术语描述了催化(33.3%)和水解酶活性(20.0%)(图3).剩余类别较少。考虑到生物过程类,绝大多数GO赋值对应于更普通的运输类别(〜78.8%)(图3 b).最后,对于细胞组分类,该分配主要给予体液(36%),线粒体(33%)和细胞质膜结合囊泡(29%)组分(图3 c).64个转录本与46种不同的酶相关联,因为它们被分类和描述到酶库[8].46种酶中有35种映射到55个KEGG生化途径[9].我们知道,有些酶可以通过多种途径产生;另一方面,有8种酶只作用于单一途径,被归类为途径特异性(数据未显示)。

图3
图3.

给番红花假定转录本分配植物基因本体论术语.A.分子功能B.生物过程C.细胞成分具体操作请参见方法。

番红花柱头表达的基因

contig中EST的丰度可以指示柱头组织中mRNA的相对丰度。我们鉴定了由≥20个ESTs组成的tc(见表)2).最高表达的TC,CL000057:2(547 EST),对短链脱氢酶具有同源性(PF00106.12)。该蛋白质家族包括参与激素生物合成的成员,如ABA2.拟南芥促黄酮类化合物转化为ABA醛的基因[10,或在性器官身份,如TASSELSEED2TS2)基因(图4).TS2在玉米的雌蕊原基细胞中表达,激活细胞死亡过程,从雄性生殖器官中消除这些细胞[11].生化研究表明,TS2蛋白是一种羟类固醇脱氢酶[12].确定Saffron Cl000057:2产品的功能和衬底特异性将是有趣的。

表2高表达了TCS
图4
装具

表达蛋白的ClustalW序列比对番红花属耻辱.A. Cl000057:2, aligned with short chain alcohol dehydrogenases: Arabidopsis ABA2 (GenBank acc. Cl000057:2)NP_175644)和玉米TS2 (GenBank acc。P50160)。B. Cl000627:1,对准番红花属crocetin糖基转移酶2P50160)。C. Cl000468:1,与Bixa番红花属羧基甲基转移酶(Genbank Acc。CAD70190和CAD70566)D. C1000045:1,与花椰菜或(Genbank Acc。ABH07405)对齐。

大量细胞色素p450序列在藏红花柱头中表示,其中一些在非常高的水平(表23.).此外,脂质代谢似乎非常活跃,从编码该过程中涉及的蛋白质的TCS判断(表3.).

表3按假定函数分组的tc

几种tc编码推测的类胡萝卜素代谢酶(见表)3.): Cl000944:1编码非血红素-β-胡萝卜素羟化酶,该酶在藏红花柱头中高度表达[13].Cl000627:1个编码的推定的葡糖基转移酶,非常类似于UGTCs2,其能够糖基化藏花酸在体外3.)(图4).Cl001532:1和Cl001032:1也编码推测的类异戊二烯GTases,其中一个可能代表仍然缺失的负责苦瓜素糖基化的酶(图)1).Cl001432:1编码一种类似于质体末端氧化酶的蛋白质,参与phytoene去饱和[14而EST cr36_B21编码一种类似于纤维蛋白的蛋白质,纤维蛋白是辣椒色素质体中的一种类胡萝卜素结合蛋白[15].Cl000468编码一个羧基甲基转移酶,非常类似于催化合成bixin的酶[16)(图4).该TC似乎编码了来自Genbank的Annatto和Cacus甲基转移酶的“短”形式,可能来自替代剪接(图4).虽然萨红星耻辱尚未描述甲基转移酶反应,但哌本断的生物合成和蟹蛋白的生物合成共有一些特征,因为两种颜料都来自类胡萝卜素的氧化切割[17].最后,Cl000045:1编码了一种与花椰菜高度相似的蛋白质基因产物,具有富含半胱氨酸的DNAJ结构域的塑性相关蛋白。占主导地位突变诱导花椰菜花序中β-胡萝卜素的积累,提示不知何故涉及染色体分化的控制[1819].

一些tc编码假定的转录因子(表3.).最丰富的表达CL000348:1,用LHMYB的高相似性编码了一种高相似性的蛋白质(来自百合属植物, GenBank accession BAB40790非洲菊20.] - 也显示与CL000348:2)和MYB305的相似之处(来自Antirrhinium21])。这三种因素在花中都高度表达。Cl001329:1也是高表达的,它编码一个推测的MADS box转录因子。该蛋白与AODEF相似,AODEF是一种具有b功能的转录因子芦笋在雄蕊和内花被片中表达[22]并向LMADS1,一种百合蛋白,其各向异性负面形式的异位表达导致AP3.拟南芥的类表型[23].

最后,Cl000209:1(61个est) Cl000582:1(18个est) Cl001827:1(5个est)和Cl000731(2个est)几个TCs与potyvirus序列具有相似性,表明测序文库可能来源于病毒感染组织。众所周知,像虹膜温和花叶病毒这样的potyvirus会感染番红花属24].这些TCS的序列将证明可用于诊断和植物检疫目的。

结论

番红花基因数据库(6为藏红花柱头组织的表达模式分析及该物种的基因组特性的初步研究提供参考。完整的原始EST序列及其电泳图保存在数据库中,以便用户调查图书馆质量和单个EST结构特征(媒介污染、重复区域)。为单个ESTs及其组件提供注释(暂定共识),以评估自动化功能分配的一致性。被确定与酶相关的假定转录本被组织成类,也可以从酶分配到代谢途径的角度来观察。这是研究柱头转录组特性的一种直接方法。如上所述,该转录组包含一系列有趣的序列,其功能现在可以使用体内或体外方法进行测试。

方法

EST测序

成熟藏红花柱头lambda Uni-ZAP定向cDNA文库[2斯特拉斯堡大学Bilal Camara教授善意提供。使用exassist辅助噬菌体和溶液菌株根据制造商的方案(Stratagene Uni-Zap手册)和溶液,用氨苄青霉素,IPTG和X-GAL涂覆在体内切除噬菌体中含有噬菌体的PBLUESCRECT噬菌物。白菌落用手挑选,并在LB +氨苄青霉素的LB 384孔板中生长过夜。约。使用含有384销的工具(VP Scientific)在含有50μL的20μLPCR反应中,将每个饱和培养物中的每种饱和培养物中的每一个引物T3和T7(Stratagene)和0.5u Taq聚合酶(GE Healthcare)中的每种饱和培养物(VP科学)接种。使用以下PCR循环(94℃2')扩增384孔格式的反应,然后进行变性步骤(94℃'),其次为35个变性(94℃45“)退火(50℃45”)和伸长率(72°C 2'),然后是伸长步骤(72℃10')。约。通过在1%琼脂糖凝胶上加载2ml来检查PCR反应的1/4,还通过进一步加工含有> 80%扩增的鲁棒单带的平板。通过凝胶过滤在384孔深阱PVDF板上(康宁猫3531)纯化PCR反应。 Each well was filled with 250 mL of resin (3.5% Sephadex G-100, GE Healthcare) and the resin was packed by centrifugation at 3.000 × g for 5'; after addition of 150 mL of resin, the plate was re-centrifuged as above; 10 mL of the PCR template were loaded in each well and the purified reaction was collected by centrifugation as above.

3mL PCR模板用于用T3引物在384孔格式中以10mL的最终体积进行测序。根据制造商的说明,使用稀释1:16,使用Bigdye终结器套件V 3.1(应用生物系统)。使用6.5%Sephadex G-50良好(GE Healthcare),通过凝胶过滤除去染料终止剂(参见上文)除去染料终止剂。将反应加载到具有50cm毛细管的ABI 3730序列子上。

EST处理和CONTIG组装

使用在那不勒斯大学发育的管道Parpest分析电泳图[5].使用phred进行序列呼叫[4的质量临界值为0.05。使用重复遮罩识别媒介污染[25]和NCBI的UniVec作为过滤数据库。RepeatMasker和RepBase [26]用于过滤和掩蔽低复杂度的子序列和分散重复序列。使用PaCE进行EST聚类[27],使用默认参数。cluster中的所有ESTs使用CAP3组装成contigs [28的重叠窗口有60个核苷酸,最低评分为85分。

功能注释

使用BLASTX与UNIPROTKB / SWISS-PROT数据库进行比较原始EST数据和CONTIG [29].筛选Blast搜索的e-value滤波比0.001更少。转录物与基因本体论术语之间的关联在MyGo数据库中报告蛋白质受试者的登录数量时发生。使用Map2slim.pl脚本将与每个最佳BLAST命中的所有GO术语转换为植物SLIM术语,作为Go-Perl包的一部分(0.04)分发。从......基因本体网页[30.].如果EC出现在每个最佳BLAST命中的描述行中,那么转录本和酶委员会(EC)编号之间的关联就会发生。与EC数字相关的转录本也与myKEGG相关,并可以映射到代谢途径上。

多个对齐一代

集群序列比对[31使用EBI web界面执行[32].

参考

  1. 1.

    藏红花的生物学、生物技术和生物医学。植物科学进展,2004,2:127-159。

    中科院谷歌学术

  2. 2.

    Bouvier F,Suire C,Muterer J,Camara B:Chormoplast类胡萝卜素的氧化重塑:Carotenoid DiOxygenase CSCCD和CSZCD基因的鉴定,参与Crocus次生代谢物生物发生。植物细胞。2003,15(1):47-62。10.1105 / TPC.006536。

    PubMed.中科院公共医学中心文章谷歌学术

  3. 3.

    Moraga Ar,Nohales PF,Perez Ja,Gomez-Gomez L:甘蔗糖蛋白酶鳄鱼的葡萄糖化由从番红花三糖蛋白酶分离的葡萄糖转移酶。Planta。2004,219(6):955-966。10.1007 / s00425-004-1299-1。

    PubMed.中科院文章谷歌学术

  4. 4.

    Ewing B, Hillier L, Wendl MC, Green P:使用phred自动音序器追踪的基础呼叫。即精度评估。中国生物医学工程学报,2017,32(3):457 - 461。

    PubMed.中科院文章谷歌学术

  5. 5。

    D’agostino N, Aversano M, Chiusano ML: ParPEST:基于并行计算的EST数据分析管道。生物信息学。2005,6(增刊4):S9-10.1186/1471-2105-6-S4-S9。

    PubMed.公共医学中心文章谷歌学术

  6. 6。

    http://www.saffrongenes.org.

  7. 7。

    D'Agostino N,Aversano M,Frusciante L,Chiusano ML:Tomatest数据库:在Silico开发EST数据中,以探索番茄种类中的表达模式。核酸RES。2007,35(数据库):D901-905。10.1093 / nar / gkl921。

    PubMed.公共医学中心文章谷歌学术

  8. 8。

    Kanehisa M,Goto S,Hattori M,Aoki-Kinoshita KF,Itoh M,Kawashima S,Katayama T,Araaki M,Hirakawa M:从基因组学到化学基因组学:Kegg中的新发展核酸RES。2006,34(数据库):D354-357。10.1093 / nar / gkj102。

    PubMed.中科院公共医学中心文章谷歌学术

  9. 9。

    Bairoch A:2000年的酶库。核酸RES。2000,28(1):304-305。10.1093 / nar / 28.1.304。

    PubMed.中科院公共医学中心文章谷歌学术

  10. 10。

    Gonzalez-Guzman M, Apostolova N, Belles JM, Barrero JM, Piqueras P, Ponce MR, Micol JL, Serrano R, Rodriguez PL:短链醇脱氢酶ABA2催化黄毒素转化为脱落醛。植物学报。2002,14(8):1833-1846。10.1105 / tpc.002477。

    PubMed.中科院公共医学中心文章谷歌学术

  11. 11.

    Calderon-Urrea A,Dellaporta SL:细胞死亡和细胞保护基因确定玉米雌蕊的命运。发展。1999年,126(3):435-441。

    PubMed.中科院谷歌学术

  12. 12.

    Wu X, Knapp S, Stamp A, Stammers DK, Jornvall H, delaporta SL, Oppermann U:植物必需短链脱氢/还原酶TASSELSEED 2的生化特性。中国海洋大学学报(自然科学版),2007,27(5):1172-1182。10.1111 / j.1742-4658.2007.05642.x。

    PubMed.中科院文章谷歌学术

  13. 13.

    在藏红花及其近缘植物柱头发育过程中,类胡萝卜素生物合成基因对伪胡萝卜素形成的影响。植物营养与肥料学报。2005,29(2):429 - 434。10.1104 / pp.105.067827。

    PubMed.中科院公共医学中心文章谷歌学术

  14. 14.

    Carol P,Kuntz M:血压末端氧化酶来亮起:对类胡萝卜素生物合成和氯镁的影响。趋势植物SCI。2001,6(1):31-36。10.1016 / s1360-1385(00)01811-2。

    PubMed.中科院文章谷歌学术

  15. 15.

    Deruere J,Romer S,D'Harlingue A,Backhaus Ra,Kuntz M,Camara B:纤维组件和类胡萝卜素在染色体上过分累积:超分子脂蛋白结构的模型。植物细胞。1994,6(1):119-133。10.1105 / TPC.6.1.119。

    PubMed.中科院公共医学中心文章谷歌学术

  16. 16。

    Bouvier F, Dogbo O, Camara B:食品和化妆品植物色素bixin(红木)的生物合成。中国科学(d辑)。10.1126 / science.1085162。

    PubMed.中科院文章谷歌学术

  17. 17。

    染料或不染料:红木生物化学揭开面纱。生物技术进展,2003,21(12):513-516。10.1016 / j.tibtech.2003.10.001。

    PubMed.中科院文章谷歌学术

  18. 18。

    Lu S,Van Eck J,周X,Lopez AB,O'Halloran DM,Cosman Km,Conlin BJ,Paolillo DJ,Garvin DF,Vrebalov J,Kochian LV,Kupper H,Earle Ed,Cao J,Li L:花椰菜或基因编码富含DNAJ半胱氨酸的含域的蛋白质,其介导高含量的{β} - 碳缩醛积聚。植物细胞。2006,18:3594-3605。10.1105 / TPC.106.046417。

    PubMed.中科院公共医学中心文章谷歌学术

  19. 19。

    Giuliano G,Diretto G:染色体和伴侣。趋势植物SCI。2007年。

    谷歌学术

  20. 20.

    Elomaa P,Uimari A,Mehto M,Albert Va,Laitinen Ra,Teeri Th:在格伯拉Hybrida(Asteraceae)的Anthocyanin生物合成的激活表明,古代分叉的单焦点和犹太病之间的保守蛋白质和蛋白质 - 启动子相互作用。植物理性。2003,133(4):1831-1842。10.1104 / pp.103.026039。

    PubMed.中科院公共医学中心文章谷歌学术

  21. 21。

    杰克逊D,Culianez-Macia F,Prescott AG,Roberts K,Martin C:来自Antirrhinum花的MyB基因的表达模式。植物细胞。1991,3(2):115-125。10.1105 / TPC.3.2.115。

    PubMed.中科院公共医学中心文章谷歌学术

  22. 22。

    陈志强,陈志强,陈志强,等:芦笋雌雄异株雄蕊和花被中b -功能MADS-box基因AODEF的表达。植物学报,2003,31(6):827 - 834。10.1023 /: 1023097202885。

    PubMed.中科院文章谷歌学术

  23. 23.

    Tzeng T-Y,Yang C-H:来自百合(百合Longiflorum)的疯子箱基因足以通过与拟南芥的激发菌(PI)相互作用来产生显性的阴性突变。植物细胞生理。2001,42(10):1156-1168。10.1093 / PCP / PCE151。

    PubMed.中科院文章谷歌学术

  24. 24.

    影响某些球茎和球茎花作物的病毒。生物学报。2001,4:40-42。

    谷歌学术

  25. 25.

    http://www.repeatmasker.org

  26. 26.

    jurka j:Repbase更新:数据库和电子杂志的重复元素。趋势类型。2000,16(9):418-420。10.1016 / s0168-9525(00)02093-x。

    PubMed.中科院文章谷歌学术

  27. 27。

    Kalyanaraman A,Aluru S,Kothari S,Brendel V:并行计算机上的大EST数据集的高效聚类。核酸RES。2003,31(11):2963-2974。10.1093 / nar / gkg379。

    PubMed.中科院公共医学中心文章谷歌学术

  28. 28。

    黄旭,马丹A: CAP3: DNA序列组装程序。中国生物医学工程学报,2019,39(9):1043 - 1046。10.1101 / gr.9.9.868。

    PubMed.中科院公共医学中心文章谷歌学术

  29. 29。

    Wu CH, Apweiler R, Bairoch A, Natale DA, Barker WC, Boeckmann B, Ferro S, Gasteiger E, Huang H, Lopez R, Magrane M, Martin MJ, Mazumder R, O’donovan C, Redaschi N, Suzek B:通用蛋白质资源(UniProt):蛋白质信息的扩展宇宙。核酸学报2006,34(数据库):D187-191。10.1093 / nar / gkj161。

    PubMed.中科院公共医学中心文章谷歌学术

  30. 30.

    http://www.geneontology.org/go_slims/goslim_plant.obo.

  31. 31.

    Thompson JD,HIGGINS DG,Gibson TJ:Clustal W:通过序列加权,位置特定的间隙惩罚和重量矩阵选择提高逐行多序列对准的灵敏度。核酸RES。1994,22(22):4673-4680。10.1093 / NAR / 22.222.4673。

    PubMed.中科院公共医学中心文章谷歌学术

  32. 32.

    http://www.ebi.ac.uk/clustalw

下载参考

致谢

由意大利研究部(FIRB项目)和意大利农业部(Agronanotech项目)支持的工作。我们感谢Bilal Camara教授提供藏红花柱头cDNA文库,Laura Spanò教授指导DP博士工作,Francesca Cecchi帮助处理电泳图。这是DISSPAPA第151号捐款。

作者信息

从属关系

作者

相应的作者

对应到Giovanni Giuliano

额外的信息

相互竞争的利益

作者宣称没有相互竞争的利益。

作者的贡献

GG计划并监督整个工作。DP进行测序。MLC计划并监督NDA实施的生物信息学工作。本文由GG和MLC撰写。所有作者阅读并批准了最终的手稿。

作者的原始提交的图像文件

权利和权限

开放获取本文在“生物资源”中央有限公司的许可下公布了这是一个开放式访问条款,分配根据创意公约归因许可证的条款(https://creativecommons.org/licenses/by/2.0)提供任何介质中的不受限制使用,分发和再现,所以提供了正确的工作。

再版和权限

关于这篇文章

引用这篇文章

D'Agostino, N., Pizzichini, D., Chiusano, M.L.等等。来自藏红花耻辱的EST数据库。BMC植物BIOL.7,53(2007)。https://doi.org/10.1186/1471-2229-7-53

下载引用

关键词

  • 藏红花
  • 酶委员会
  • 藏红花素
  • 胭脂树橙
  • 鳄鱼