跳到主要内容

油棕(Elaeis guineensis组织培养est:鉴定与胼胝体发生和胚胎发生相关的基因

摘要

背景

油棕(Elaeis guineensis是世界上最重要的含油作物之一。然而,通过传统育种的油棕遗传改良极其缓慢和昂贵,因为育种周期可能长达10年。这引起了人们对油棕无性繁殖的兴趣。自从20世纪70年代引入油棕组织培养以来,无性系繁殖已被证明是有用的,不仅在生产统一的种植材料方面,而且在基因工程计划的发展方面。尽管组织培养技术的进步很大,但增殖愈伤组织培养的愈伤组织形成率和胚胎发生率仍然很低。因此,了解油棕组织培养中的基因多样性和表达谱对提高这些过程的效率至关重要。

结果

本研究共生成了12个标准cDNA文库,代表油棕组织培养的三个主要发育阶段。从这些cDNA文库中的克隆随机测序产生17599个表达的序列标签(est)。对ESTs进行分析、注释和组装,生成9584个推定unigenes,分布在3268个共识序列和6,316个单例序列中。根据相似度和基因本体注释为这些unigenes赋以假设函数。聚类分析,根据每个共识中ESTs的丰度调查每个文库的相关性,显示脂质转移蛋白在胚胎发生组织中高度表达。谷胱甘肽s -转移酶在非胚性愈伤组织中高度表达。进一步分析unigenes发现了648个非冗余简单序列重复和211个假定的全长开放阅读框。

结论

本研究综述了油棕组织培养过程中表达的基因。确定了在组织培养过程中表达被调节的候选基因。然而,为了确认这些基因是否适合作为胚胎发生的早期标记,这些基因需要在组织培养的早期阶段和更广泛的基因型中进行测试。这些无害环境技术的收集是油棕遗传和基因组分析的重要资源,特别是在组织培养过程中。

背景

油棕属于棕榈科和棕榈属Elaeis.这个属中有两个重要的种Elaeis大肠guineensis而且e .鉴定.这种二倍体的单子叶植物在单一的营养顶端上保持优势,因此不产生不定芽或辅助芽。在组织培养技术出现之前,油棕的无性繁殖还没有可靠的方法[1].这使得组织培养成为油棕产业发展的一个重要方面[2],尤其在生成优质均匀的油棕种植材料方面。Staritsky在油棕组织培养方面的开创性工作[3.和拉比绍.[4].

组织培养技术的使用被预测可以提高石油产量,后来证实了这一点,与商业化生产相比,产量显著提高(高达30%)硬脑膜×Pisifera(D × P)幼苗大规模田间试验[56].油棕组织培养主要是从幼叶在愈伤组织诱导培养基中开始的。愈伤组织,外表呈结节状,形成于静脉暴露的切口边缘[7].部分愈伤组织保持致密和结节状,并经历胚胎发生[78].这一过程最终导致体细胞胚的形成和成熟,芽的再生,生根,最终恢复新的活苗。然而,愈伤组织也可以形成柔软、颗粒状和半透明的组织,不具有任何胚胎形成的潜力[7].这些组织被定义为非胚性愈伤组织,并将保留为愈伤组织,没有产生新植株的很大希望。

愈伤组织和体胚的形成是油棕组织培养的主要瓶颈之一。油棕外植体胼胝体发生率仍然很低,约为19% [9].Wooi也报道了此事[10叶源性愈伤组织的平均胚胎发生率为3% ~ 6%。尽管油棕组织培养具有重要的经济价值,但有关油棕胼胝体和胚胎发生的化学特征和分子变化却知之甚少。

在植物中,许多方法被用来了解基因表达和相互作用的复杂性。其中一种方法是表达序列标记(EST)。自引入以来,该技术已被证明是一种快速有效的方法,可以从各种各样的组织、细胞类型或发育阶段获取基因多样性和mRNA表达模式的信息[11- - - - - -13].该技术鉴定油棕基因的有效性在Jouannic.[14报告了从雄性和雌性花序、芽尖和合子胚胎中产生的2,411条ESTs。最近,何鸿燊.[15]还从油棕合子胚、悬浮细胞、茎尖分生组织、幼花、成熟花和根中鉴定出14537个ESTs。

在过去的几年里,人们对应用EST方法来理解与组织培养相关的分子机制越来越感兴趣。例如,在Cichorium intybus,从组织培养样本中分离到2,348个ESTs,其中在胚胎源性和非胚胎源性基因型中鉴定出33个差异表达基因[16].对体细胞胚胎发生深入了解的努力也导致了在体细胞胚胎发生过程中大量表达的基因的鉴定[1718],胚胎特异性基因[19和一种由非胚性愈伤组织专门分泌的糖蛋白[20.].许多与胚胎发生相关的基因,如胚胎发育后期丰度(LEA)、体细胞胚胎发生受体激酶(SERK) agamouslike 15 (AGL15)、生育高峰期(BBM)、叶子叶1 (LEC1)、Fusca3 (FUS3)和叶子叶2 (LEC2),在合子和体细胞胚胎发生过程中均表达[21].

为了了解油棕组织培养过程中表达的基因,从油棕组织培养发展的三个主要阶段生成了一套大量的油棕ESTs。该EST集合的分析允许识别与体细胞胚胎发生相关的候选基因。

结果

cDNA文库的特征

从叶源性胚性愈伤组织(EC)、非胚性愈伤组织(NEC)和胚状体(EMB)中共生成了12个cDNA文库。为了产生有用的测序读取,所有12个库在单遍测序之前都进行了大小分级和定向克隆。在开始大规模测序之前,对所有的库进行了小规模的质量评估1).12个扩增文库的滴度范围为1.22 × 109到6.10 × 109Pfu /ml和重组克隆率在54.8% ~ 97.0%之间。这些库的插入大小从250 bp到2300 bp不等,平均约为1 kb。

表1 12个油棕cDNA文库特征

是一代

从12个cDNA文库中共获得20949个5'端reads,共获得17599个高质量序列,平均编辑长度为465个碱基。为了便于进一步分析,从12个cDNA文库中生成的序列被按照胚胎性愈伤组织(EC)、非胚胎性愈伤组织(NEC)和胚状体(EMB)三个不同的发育阶段进行了相应的分组2).总体测序成功率约为84%。est最多的是EMB库,其次是NEC库和EC库。本研究生成的EST序列存入GenBank,登录号为EY396120-EY413718。

表2 EST测序总结

在17599份ESTs中,只有57.6%使用囊胚分析进行了推定鉴定。匹配e值≤10-10假设与GenBank非冗余蛋白数据库中的已知序列具有显著的相似性[2223].有很大比例的est与GenBank中的序列没有显著的相似性。这可能是因为这些序列的平均长度(389个碱基)比与GenBank条目(521个碱基)显著相似的ESTs短。

在氨基酸序列相似性显著的ESTs中,有3.1%(311/10,138)与先前鉴定和鉴定的油棕基因相似。这些基因,包括金属硫蛋白样蛋白[24]、翻译控制肿瘤蛋白和甘油醛3-磷酸脱氢酶见表3..通过与已知的油棕基因序列的比较,可以看出编码金属硫蛋白样蛋白的基因是最丰富的,占到与油棕基因匹配显著的est总数的37.6%(117/311)。类金属硫蛋白是从高等植物中分离出来的基因,包括单子叶植物(小麦、玉米)和双子叶植物(拟南芥) [25- - - - - -27].这些基因在重金属解毒中发挥作用,特别是在镉、铜和锌方面[28].据报道,在油棕中,I类3型金属硫蛋白样基因MT3-A和MT3-B在表达为谷胱甘肽- s -转移酶/MT3-A的融合蛋白时,对锌具有很强的结合亲和力[24].

表3具有显著相似性的ESTs的频率Elaeis序列

无害环境技术聚类

为了评估每个文库中的基因发现率,StackPACK分析[29],并计算每个库中的unigenes(一致和单例的总数)。每个库中唯一序列的比例不相似,在57%到78%之间2).观察到的广泛范围可能是由于EC库没有深入采样的事实。除EC库外,可聚类为共识的ESTs数量相当接近,NEC和EMB库分别为61%和52%。这表明这些抄本在这些图书馆中几乎平均分布。

为了进一步识别唯一序列和删除库之间的冗余,所有est都被聚类。对17599个ESTs进行聚类分析发现9584个unigenes。该分析形成了3268个一致序列(占总ESTs的11283个,占64%),平均一致长度为666个碱基。其余6316个序列为单子序列,平均长度为449个碱基。在这9584个unigenes中,有5299个与GenBank非冗余蛋白数据库中的已知序列具有显著相似性,e值截断值为10-10.其余4285个(44.7%)序列与数据库中任何已知序列均无显著相似性。附加文件中提供了库的组装结果1

对来自多个文库的ESTs进行测序的另一个主要优势是能够识别在特定组织内或在特定发育阶段特定转录的基因。该研究显示,10,602个序列(60%)是三个样本组织中的一个所独有的(表4).不出所料,几个转录本在所有三种组织样本中广泛表达。总共有268个不同的共识包含来自所有三个组织的ESTs。这些转录本可能代表基因,如那些与家务有关的基因,在这些组织中很常见(图1和表5).检测到的最丰富的转录本被推测为核糖体蛋白S3 (336 ESTs;cn0037),其次是金属硫蛋白样蛋白(117 ESTs;cn3069)和一个假设的蛋白质(109 ESTs;cn0752)。核糖体蛋白是生命系统的基础蛋白,是蛋白质转译的媒介,因此核糖体蛋白的高鉴定率是意料之中的。

图1
图1

cDNA文库中一致性的分布.共检测了3268个cDNA文库的一致性分布。

表4单个组织特异性序列的鉴定
表5三种组织中最丰富的20个序列的假定身份

蛋白质编码区

并对序列进行分析,以确定其基本偏好Elaeis guineensis,这可以用于预测油棕基因组的编码区域。这是通过识别unigene数据集中的全长开放阅读帧(orf)来实现的。使用blastx对9584个unigenes的同源性搜索结果用于识别与已知基因相似度较高(评分为> 200)、帧内起始和终止密码子位置与GenBank序列相似的unigenes。选择起始和终止密码子位置与GenBank中蛋白质序列相似的油棕序列,可以获得更严格和更准确的全长orf数据集。

共鉴定了272个orf,并将其转化为氨基酸序列。重新提交氨基酸序列进行同源性搜索,以确定全长orf。基于重新提交的结果,211个氨基酸序列被确定为推测的全长orf。该序列具有与GenBank序列相似的起始密码子、帧内终止密码子和3个非翻译区域(UTR),说明该氨基酸序列在正确的阅读框中翻译。完整的orf也存放在GenBank中,加入号为EU284816-EU285026。全长的密码子使用表Elaeis guineensisorf随后使用CODONW生成。油棕(Elaeis guineensis)包含44,372个密码子的密码子使用表见表6.从密码子使用情况表可以看出,预测编码区GC含量(48.4%)高于预测的3 UTR(37.8%),第三位GC频率为51.5%。其中一个显著特征是TGA是首选的终止密码子,在42.2%的序列中出现。

表6中密码子的使用Elaeis guineensis

est衍生的简单序列重复标记

对从17,599个est中组装的9,584个unigenes进行数据挖掘,在586个unigenes中发现了648个非冗余SSRs。unigenes约为5.0 Mb的基因序列。共有56个序列包含一个以上的SSR。NR est衍生SSRs由单核苷酸、二核苷酸、三核苷酸、四核苷酸和五核苷酸重复基序表征。这相当于每7.7 kb约有一个SSR的总体密度,或6.1%的NR EST序列中含有SSR的序列。约3.4%的SSRs被鉴定为复合SSRs,它被定义为两个相邻的重复序列,在单个序列中间隔不到10个核苷酸。从9584个unigenes中鉴定出的SSR基序的频率汇总在表中7

表7非冗余基因衍生SSRs的频率

从SSR基序的分布来看,AG/CT基序是二核苷酸重复基序中最丰富的。这些基序约占二核苷酸重复基序的67%,而AT(21%)、AC/GT(11%)和CG(0.3%)的丰度相对较低。三核苷酸重复序列中,AAG/CTT(23%)最多,其次是AGG/CCT(13%)、CCG/CGG(11%)和AAT/ATT(11%)。其余三核苷酸重复基序的丰度较低(<10%),其中AGT/ATC重复基序的丰度最低(4%)。最丰富的四核苷酸重复基序是ACAT/ATGT(36%)和AAAT/ATTT(29%)基序。重复图案的分布如图所示2

图2
图2

不同SSR基序(单核苷酸、二核苷酸、三核苷酸、四核苷酸和五核苷酸)的百分比分布。

对211个推测的全长ORF进行了分析,以挖掘SSR序列,并确定所识别的SSRs的位置(UTR或ORF)。在17条序列中共鉴定出18个ssr位点。鉴定出2个单核苷酸,7个二核苷酸和9个三核苷酸重复序列。单核苷酸和二核苷酸重复序列仅在UTR中被识别,而三核苷酸重复序列在ORF和UTR中都被识别。ORF区有较高比例(66.7%)的三核苷酸重复序列。这些SSRs在假定的全长orf中的分布见表8

表8假定全长orf中SSRs的分布

基因本体标注

使用Blast2GO对17599份油棕ESTs进行基因本体论(GO)注释[30.].该软件对GenBank非冗余蛋白数据库进行blastx相似性搜索,检索前20个BLAST结果的GO术语,并根据定义的标准对序列进行注释。共有8,436个est被成功注释为GO术语。为了帮助提高带有GO术语注释的序列的数量,使用InterProScan获得了ESTs的附加信息。另外755个序列被注释。总的来说,总共有9191个ESTs注释了33,742个GO术语,分布在三个主要的GO类别中,分别是生物过程(9,253)、分子功能(13,140)和细胞成分(11,178)。用GO术语表示的est的数量可能被低估了,因为47.8%的est没有注释。一般来说,没有BLAST命中(3100)的序列不能被注释。然而,有2205个BLAST命中的ESTs也不能被注释,另有3103个序列不满足所选的注释标准。由于序列与假设的或未知的蛋白质相似,2205个BLAST命中的基因中的大多数无法用GO术语进行注释。

通过WEGO检测了不同氧化石墨烯术语的基因表达[31].计算了每一GO项中无害环境技术的分布和百分比。100的百分比被定义为在一种组织类型中指定氧化石墨烯术语的est的总数,.NEC, EC或EMB。然而,必须注意的是,子类别的百分比加起来并没有达到100%,因为许多ESTs涉及不同的函数类,并注释了多个GO术语。总的来说,基于GO条件的基因在所有三种组织中的分布是相当相似的。

大约59.8%的ESTs注释被归为GO主要类别生物过程中的“细胞过程”类别9).这一范畴包括在细胞水平上进行的过程,如细胞周期、细胞通讯和细胞发育。生物过程中第二高的类别是“代谢过程”类别,占注释的57.1%。这个类别有涉及光合作用,代谢和调节代谢过程的子类别。然而,这两个类别有重叠的子类别,特别是那些涉及细胞代谢过程。有趣的是,5.1%的注释被归入“对刺激的反应”子类别。其中307(3.3%)和248(2.7%)个est分别涉及对应激和化学刺激物的响应函数。这并不奇怪,因为有人认为组织培养环境可以诱导应激反应机制[32].

表9由NEC、EC和EMB cDNA文库生成的ESTs的基因本体(GO)功能分类

根据该子类注释在个体组织中的分布情况,ESTs在NEC(3.6%)中最少,在EC(4.5%)和EMB(6.2%)中逐渐增加。应激反应基因的表达可能是应对和适应与组织培养相关的应激条件所必需的,如机械损伤、渗透休克和激素失衡。耐压能力不可避免地有助于培养系向胚状体的增殖。

在分子功能主类中,48.9%的EST注释归为绑定类9).其中,1777个和1430个ESTs分别被注释为“核酸结合”和“离子结合”。另一个具有较高代表性的类别是“催化活性”。至少有10%的无害环境技术相关的特定催化活性是水解酶、转移酶和氧化还原酶亚类,分别为1 173、1 118和982种无害环境技术。这些基因参与信号转导、代谢和翻译后修饰等过程。

硅片筛选和北方印迹分析

数字北方或在网上进行减法以确定在NEC或胚性培养(EC/EMB)中特异性的候选基因或标记。分析的依据是特定组织中ESTs的频率与该组织中基因表达的关系[163334].通过分析,可以确定可能代表触发胚胎发生过程的基因的转录本。

为此目的,3268份共识被编译成一个矩阵文件,其中包含三个组织(EC、NEC和EMB)对应的每个共识序列中ESTs的频率。在IDEG6中采用Stekel和Falciani统计检验(R检验)[35]的显著性阈值为0.001,共鉴定出52个(1.6%)unigenes。阈值(0.001)允许选择差异表达基因,且几乎没有假阳性[35].Stekel和Falciani统计检验用于比较来自多个cDNA文库的基因表达[36].共发现30和22个unigenes分别在NEC和EC/EMB中差异表达(表10).聚类分析以确定组织之间的相关性为基础,在每个共识转录本的丰度,显示NEC样本明显不同于EC和EMB培养(图3.).

表10 NEC、EC和EMB组织中ESTs的分布,显著性阈值为0.001
图3
图3

标准化EST分布在52个一致性集合中的层次聚类.EC、NEC和EMB分别来自胚性愈伤组织、非胚性愈伤组织和胚状体cDNA文库。从每个组织获得的特定一致性中ESTs的频率用增加的红色强度表示。

根据鉴定的基因,15个unigenes仅在NEC中存在,而7个unigenes的ESTs仅在EMB中存在。另外两组15个unigenes分别在NEC和EC/EMB中表达较高。结果表明,脂质转移蛋白(cn2473)、过氧化氢酶2 (cn3157)、pvr3样蛋白(cn3238)、防御素EGAD1 (cn1673)和脱氢蛋白样蛋白(cn2100)是EC/EMB中高表达的基因。鉴定的转录本可能参与体细胞胚胎发生的起始、发育过程中的分化以及体细胞胚胎的生长、成熟和脱水。在NEC文库中,参与脂类生物合成的肉桂醇脱氢酶似乎大量表达。应激相关基因如谷胱甘肽s-转移酶、致病相关蛋白4、葡聚糖酶和金属硫蛋白样蛋白在NEC组织中也上调。NEC文库中的大部分基因(41%)与GenBank中的序列没有显著的相似性。

从组织培养和营养组织样品中提取RNA,选取8个基因进行北方印迹分析。根据数字北方结果,筛选出了EC/EMB中丰度高于NEC的5个基因。在数字北方结果中,谷胱甘肽s -转移酶(cn0544)在NEC中丰度水平高于EC/EMB。northern blot分析还包括另外两个在NEC组织中低表达的基因,但在EC/EMB中不表达。这两个基因是一个受赤霉素刺激的转录本(cn1254有519个碱基)和一个与GenBank中的基因没有命中的转录本(cn2945有503个碱基)。进行Northern blot分析,结果见图4.结果显示出与数字北方分析中观察到的趋势相似的趋势。与EC和EMB相比,在大多数NEC样本中,五种EC/EMB增强转录本的表达量较低或未检测到(图4).然而,脂质转移蛋白和脱氢蛋白样蛋白也在矛叶中表达,防御素EGAD1和pvr3样蛋白也在花组织中表达。过氧化氢酶2在EC/EMB和矛叶中表达量较高,在NEC和中果皮组织中表达量较低。这些基因可能是区分EC/EMB与NEC的重要标记。

图4
图4

利用来自不同样品的RNA对cdna进行北方印迹分析.图4a和4b分别是使用体细胞胚胎发生和NEC相关cdna进行的northern blot结果。NEC,非胚性愈伤组织;EC,胚性愈伤组织;EMB,胚状体;SL,矛叶;F12,花周-12;K12,内核周-12;M15,中果皮第15周。18S rRNA杂交显示RNA负载相等。 Each set is represented by one NEC, EC and EMB.

对于在NEC中选择丰度较高的三个探针,在northern blot分析中,两个转录本(谷胱甘肽s -转移酶[cn0544]和一个没有命中的转录本[cn2945])在NEC中普遍被证实比EC/EMB表达更高(图4 b).表达谱在一定程度上依赖于基因型,与第1组相比,第2组表达水平的差异更大。然而,最后EST(赤霉素刺激转录本;GAST)与观测结果无关在网上分析。

讨论

本研究旨在通过从NEC、EC和EMB组织中生成17599个高质量est,对油棕组织培养过程中表达的基因进行深入研究。序列聚类发现9584个unigenes。然而,值得注意的是,unigenes的数量可能被高估了,因为不同的contigs可能代表整个基因的不同部分。目前收集的EST数据与Ho报告的EST数据有相似之处et al。15].同一油棕树种作为起始材料,采用的初步数据分析方法也相似。这将使具有不同研究目标的研究人员能够进行直接比较,并研究各种油棕组织中的基因表达。然而,Ho报告的EST数据.[15我们的研究来自不同的组织。因此,由于本研究的主要重点是检测油棕NEC、EC和EMB的基因表达,因此没有对两个EST数据集进行直接比较。目前的收集还揭示了一些突出的特征,如油棕的碱基偏好,这是以前油棕EST出版物中没有报道过的。本研究中的ESTs也被挖掘为假定的全长orf和SSR标记。

油棕转录组的特征

密码子的使用

油棕碱基偏好是准确预测油棕基因组中蛋白质编码区域的重要资源。为了实现这一目标,我们确定了211个假定的全长orf,并用于生成油棕密码子使用表。密码子使用情况表显示,GC含量(48.4%)与中GC含量相似Elaeis guineensisJouannic报告的无害环境技术et al。14(49.6%)et al。15](约48.0%),以及Kazusa密码子使用数据库中的基因(50.8%)[37].然而,在Kazusa密码子使用数据库中,第三位的GC频率(51.5%)略低于之前预测的56.4%。这种差异可能是由于与Kazusa密码子使用数据库相比,本研究中使用的数据集大小和基因不同,后者只使用了56个orf。变异的另一个原因可能是基因种类之间密码子偏好的差异,本研究中发现的约32.0%的orf编码核糖体蛋白或核糖体结构成分,而Kazusa密码子使用数据库中有较高比例的MADS box基因。事实上,浅津et al。38]之前曾报道高等生物在基因之间表现出高度可变的密码子偏好。

数据还显示,油棕在最后两个密码子位置抑制CG二核苷酸,其中XCG/XCC比值为0.48。这种CG抑制已在植物中被记录在案,因此杨树豌豆、大豆、马铃薯和菠菜的XCG/XCC比值分别为0.38、0.51、0.37、0.48和0.42 [39].这种抑制可能是由于CG二核苷酸中甲基化C到T的高突变率[3940].

est衍生SSR标记

进一步挖掘单基因序列,以识别est衍生的SSR标记。使用非冗余序列集的主要好处是提供基因组转录部分SSR基序密度的更准确表示[4142].Kantetyet al。43]观察到,与研究中所有可用的est相比,当分析非冗余序列时,冗余减少了约85.0%。基于9584个可用unigenes,共鉴定出648个ssr。SSRs的总体密度(每7.7 kb 1个SSR)与Varshney报告的密度相似et al。44]在大麦(1/7.5 kb)和玉米(1/7.5 kb)中。其密度与EST序列中每7.73 kb出现一个微卫星基序相似Coffea41].然而,油棕的SSR密度低于小麦(1/6.2 kb)、黑麦和高粱(1/5.5 kb)和水稻(1/3.9 kb)的SSR密度,这些SSR密度在1/3.9 kb到1/6.2 kb之间[44].这些差异可能是由于不同的SSR搜索标准和使用的软件。

在确定的二核苷酸重复基序中,AG/CT重复是数据集中最常见的。AG和CT重复序列的丰富也有报道Coffea41,大麦[45和小麦[46].Kantetyet al。43]表明GA和CT基序的高出现水平是由于基序翻译氨基酸产物的高频率。GA/CT基序被译为GAG (Glu)、AGA (Arg)、CUC (Leu)和UCU (Ser)。这得到了油棕密码子使用表中的数据的支持。这四种氨基酸出现在25.3%的密码子中,相对于其他二核苷酸重复序列产生的氨基酸有较高的频率。最罕见的二核苷酸重复是CG/GC,这与Kantety的报道一致et al。43), Varshneyet al。44和Aspet al。47].据报道,甲基化C在CG二核苷酸中对T有很高的突变率[3940].这可以解释CG重复基序导致XCG氨基酸减少的原因。

AAG/CTT重复基序是油棕中最常见的三核苷酸重复基序。Kumpatla和Mukhopadhyay [48的研究结果表明,AAG/AGA/GAA/CTT/TTC/TCT重复基序是20个物种中16个EST集合中最主要的重复序列。三核苷酸重复也被报道为最丰富的SSR重复类[4142444647],因为它们不会导致倾向于负选择的帧移突变[48].然而,在油棕中,二核苷酸重复序列已被确定为EST数据中最普遍的重复类。至少有两份报告将二核苷酸重复序列确定为最常见的重复序列类[4849].研究表明,二核苷酸重复序列主要存在于UTR中[4150].这可能表明,在油棕EST种群中发现的SSRs大多在UTR而不是编码区,这就是为什么二核苷酸SSRs最普遍的原因。对211个全长orf的SSR分析支持了这一假设。在UTR中确定了12个SSRs(2个单核苷酸,7个二核苷酸和3个三核苷酸重复基序),而在ORF中仅确定了6个重复(全部为三核苷酸)(见表8).然而,这必须通过确定UTR和ORF在剩余的含有ssr序列中的位置来确认。

体细胞胚胎发生相关基因的鉴定

分别以NEC、EC和EMB作为组织培养的三个不同阶段,构建了cDNA文库。鉴定出的ESTs表明,所有的文库都是信息性的,可以提供每种组织类型特有的序列。通过检测NEC或EC/EMB所特有的序列,序列组装和数字北方分析确定了特定于胚源性和非胚源性组织的表达模式。该技术鉴定出52个在NEC和EC/EMB中差异表达的unigenes。组织培养是一种复杂的现象,受多种因素的影响,如培养和培养基条件、环境和所选棕榈的基因型[7].因此,不可能识别出区分NEC和EC的单一基因。因此,基因组合的表达谱是必要的,以提供可以区分这些组织的特征。这种表达谱的可用性将使油棕组织培养更具可行性,特别是因为从外植到田间种植的过程可能需要长达58个月[7].因此,52个基因的总体谱可以作为NEC和EC的初步筛选。从使用这些基因进行的聚类分析中可以明显看出,NEC组织可以与EC/EMB区分开来。然而,还需要进行进一步的工作来进一步确认和减少基因集到一个更易于管理的数量,以使其能够筛选大量的样本。

为此,研究了一些有趣的基因家族和可能在胚胎发生中发挥重要作用的基因的概况。选择的基因家族之一是脂质转移蛋白(LTP)家族。先前的研究表明ltp存在于胡萝卜的胚胎发生培养中[51]、葡萄体细胞胚[52],悬浮细胞培养[15],小孢子衍生胚胎[53的胚胎发生过程中拟南芥54].数字北方结果显示,三个LTP基因是高度冗余的,专门出现在EC/EMB中。

对与小麦LTP具有显著相似性的cn2473和cn1535这两个LTP的Northern blot分析[55]和非特异性LTP分别表明,这些基因在EC/ emb中表达非常高,而在NECs中表达极低(图4).除矛叶(cn2473)和花序(cn1535)外,其他营养组织均无表达。有趣的是,胡萝卜LTP基因的表达模式也类似,在EC/EMB中检测到其表达,但在NEC中没有检测到[51].此外,cn2473在EC中的表达似乎高于EMB。棉花也有类似的观察结果[56],与球状胚和心型胚相比,LTP在继代培养和原代胚性愈伤组织中高度表达。曾.[56]表明LTPs可能促进膜生物合成、细胞膨胀和极性分化等过程,这些过程可能是体细胞胚胎发生的限制因素。这可以解释EC/EMB中LTP基因的丰富性,特别是在胚性组织积极分裂和分化的情况下[7].然而,重要的是要注意ltp属于一个不同的基因家族,需要进行更多的研究来充分描述所识别的ltp。

参与应激反应的基因也进行了研究,因为GO分类结果显示EC/EMB中这些基因的丰度增加。这与之前的研究一致,之前的研究表明,压力可以作为诱导胚胎发生的触发器[57- - - - - -59],在愈伤组织发育过程中,应激反应基因的频率随着时间的推移而增加[60].三个应激反应基因.选择过氧化氢酶2、防御素EGAD1和脱氢蛋白样蛋白进行northern blot分析(图4).

结果表明,EC/EMB中过氧化氢酶2的表达高于NEC。Papadakiset al。61]表明,全能性烟草原生质体的细胞内和细胞外O含量低2倍和7倍2-和H2O2与非全能性原生质体细胞相比,这表明全能性的抑制与细胞抗氧化机制活性的降低有关。过氧化氢酶是解毒活性氧水平的重要成分,对H有很高的亲和力2O2,在northern blot结果中观察到的表达水平似乎支持这一理论。结果确实表明过氧化氢酶基因表达的增加可能是由于组织培养过程中产生的应激和活性化合物。虽然油棕过氧化氢酶2对活性化合物的影响还没有被测试,但解毒似乎是实现胚胎发生的重要步骤。

Northern blot分析EGAD1和脱氢蛋白样蛋白。EGAD1基因的表达谱与Tregear之前报道的相似et al。62,他们观察到转录本在不同的阶段被检测到在体外的过程。更重要的是,与正常手掌相比,EGAD1转录本在覆盖手掌的愈伤组织培养中积累更多[62].在本研究中,EGAD1在EC和EMB中表现出显著的高表达。在NEC和其他组织中几乎没有检测到任何表达,这表明它除了作为体细胞无性系变异事件的标记外,还可以预测胚胎发生。脱氢蛋白样蛋白在EMB组织中表现为强信号,在EC中表现为弱信号,而在NEC中无表达。该表达谱与Ho报道的数字北方数据一致et al。15结果表明,一种脱氢蛋白样蛋白在合子胚中表达量高,在悬浮细胞培养中表达量低,而在其他组织中未检测到。northern的结果还表明,该基因似乎是基因型依赖的,因为它在集合2中比集合1更突出。

研究了一个与生长素调节的谷胱甘肽s -转移酶(GST)具有显著相似性的基因(cn0544)的表达。在组织培养中,生长素是重要的生长调节剂,参与体细胞胚胎发生的起始[63].GSTs在菊苣胚性品种体胚培养叶中表达[64与胡萝卜体胚的形成有关[65].然而,数字北方和北方印迹结果(图4 b)显示,油棕商品及服务税在NEC库中大量存在。这并不奇怪,因为GSTs由一个庞大而多样的基因家族所代表,该家族可分为phi、tau、theta、zeta和lambda类[66].基因表达的差异暗示不同的GSTs在不同的组织培养阶段和不同的组织中受到不同的调控。

尽管如此,在网上EST数据分析及实时RT-PCR实验Cichorium intybus显示出与油棕消费税相似的趋势。该研究发现了两种GSTs优先表达于非胚性基因型的培养外植体[16].在愈伤组织增殖良好的株系中,GST基因的抑制进一步支持了这一结果[67]和培养14天后子叶正面GST表达下调[68].子叶的正面是体细胞胚胎发育的区域。然而,尽管油棕GST在Set 1和Set 2中在NEC中的表达量较高,但在Set 2中GST的表达量高于Set 1。这表明表达水平与基因型有关。

cn2945在NEC中的表达水平高于EC/EMB。虽然克隆没有显著命中,但对cn2945的分析表明,该基因具有信号肽和跨膜基序,表明其很可能跨膜脂双分子层易位。然而,观察到的表达谱也与基因型有关,因为在Set 2中表达水平的差异更显著,而在Set 1中则不是。

总的来说,所选克隆(cn1673、cn2100、cn2473、cn3157、cn3238、cn0544和cn2945)在EC/EMB或NEC中均表现出较高的表达,这表明这些基因可能与组织培养过程中这一阶段的胚胎发生有关。然而,这些基因的表达需要进一步验证,特别是在早期的胚性组织中,如原胚性包块和初级胚性愈伤组织,以确定它们在预测油棕胚胎发生中的适用性。

结论

这里报道的EST数据代表了在油棕组织培养中表达的基因的概述。从测序工作中,鉴定出9584个假定的未基因。总共有211个推测的全长orf被鉴定出来。这可能代表了油棕报告的最全面的完整orf列表。基本偏好Elaeis guineensis被确定为帮助预测油棕基因组中的蛋白质编码区域。EST也被证明是一个有价值的SSR标记来源,共鉴定出648个EST- ssrs。ssr的鉴定对油棕分子标记的开发和油棕分子标记辅助选择具有重要意义。这些标记来源于基因区域的事实增加了它们的实用性,特别是在使用候选基因方法寻找具有重要经济性状的标记时。本研究还发现了在NEC和EC/EMB组织中差异表达的基因。通过northern blot分析确定了其中一些基因的表达模式,这表明它们可能是发展为胚胎发生标记的潜在候选基因,尽管其中一些基因的表达谱似乎与基因型有关。然而,如果这些标记一起使用,基因的预测能力将会提高。目前,收集的基因被用作遗传定位的分子标记(SSR或限制性片段长度多态性[RFLP]),其主要目的之一是在定位群体中识别与胼胝体和胚胎发生相关的数量性状位点(qtl)。本研究中报道的ESTs最直接的应用是油棕cDNA芯片的开发。目前的数据集还有效地补充了之前报道的油棕EST集合,并贡献了公共数据库中现有油棕序列集合的近一半。 Although the combined dataset available currently for oil palm (about 35,000) is not even close to the number of sequences available for some model crops, they nevertheless represent a large enough resource to identify candidate genes for functional studies that will help improve the understanding of the various processes in oil palm and provide the molecular handles to improve important processes, such as oil palm tissue culture.

方法

植物材料

利用2株胚性愈伤组织(EC)、3株非胚性愈伤组织(NEC)和2株胚状体(EMB)进行cDNA文库构建。这些叶源性组织培养材料来自两个实验室。数据验证使用两组组织培养样本,每组代表NEC, EC和EMB。除了组织培养样本外,从马来西亚棕榈油委员会(MPOB)获得的刺叶、花序叶-12(雌性,5厘米)、花后12周(12 WAA)核和15 WAA中果皮组织也用于验证实验。所有的植物材料都是硬脑膜(D)×Pisifera(P)水果类型和储存在-80°C RNA提取前。

cDNA文库的构建

从组织培养过程的EC、NEC和EMB三个不同发育阶段构建了12个cDNA文库。总RNA是用罗切斯特描述的水酚萃取法分离的.[69].保利(A)+根据Singh和Cheah [70].利用ZAP-cDNA构建定向cDNA文库®合成试剂盒和ZAP-cDNA®Gigapack®III .金克隆试剂盒(Stratagene USA),根据制造商说明。

cDNA文库测序

DNA测序以噬菌体和质粒为模板。随机选取单个重组噬菌体进行测序。使用T3和T7引物扩增噬菌体插入物。使用虾碱性磷酸酶(GE Biosciences USA)和外切酶1 (GE Biosciences USA)对PCR产物进行酶促纯化,以清除多余的dNTPs和引物。质粒克隆可通过单个或批量获得在活的有机体内使用ExAssist删除®由制造商(Stratagene USA)推荐的辅助噬菌体。用Wizard制备用于测序的质粒DNA®Plus Minipreps DNA纯化系统试剂盒(Promega USA)。使用ABI PRISM™Ready Reaction BigDye™终结者循环测序试剂盒(美国应用生物系统公司)对cDNA插入物从5'端与SK引物进行测序。测序采用ABI 377自动DNA测序仪(美国应用生物系统公司)。

序列处理,聚类,BLAST搜索和注释

在聚类并存入GenBank之前,对所有序列进行质量检查。使用PHRED(版本0.020425.c)对原始abi格式的色谱图进行基调用[7172],阈值为20。交叉匹配(版本0.990329)和定制的Perl脚本用于裁剪向量、适配器、polya端和低质量核苷酸。est也被过滤为原核微生物,如大肠杆菌.只有至少有100个碱基和低于4% n的高质量est被保留。还进行了人工处理以确认结果。

多序列对齐、聚类、组装和共识生成均由StackPACK完成[29].StackPACK包含d2_cluster [73],如果在150个碱基的任意窗口中,序列相似性至少为96%,则将序列分组在一起。然后使用PHRAP对松散的簇进行对齐[74之后,CRAW [75].结果集的共识和单例被认为是一组假定的唯一基因(unigenes)。使用blastx算法将所有清洁est序列和组装一致序列的同源性搜索与GenBank进行比较。序列与blastx e值> 10-10被指定为“没有显著相似性”。

用IDEG6进行基因表达的数字分析[35通过使用从所有三种组织类型(NEC, EC和EMB)的EST频率中收集的每个共识的转录丰度。合成的基因列表在TIGR多重实验查看器软件(3.0版本)中聚类。

简单序列重复(SSR)标记的硅化鉴定

从17599个ESTs中提取的unigenes用于SSR标记。末端区域50 bp窗口内的polyA和polyT序列被删除。unigenes被挖掘为微卫星基序。对剧中(微卫星识别工具)搜索模块[76]用于微卫星基序的识别和定位。序列中单核苷酸、二核苷酸和高阶重复序列的重复单位分别为10个、7个和5个时,被认为含有微卫星基序。MISA网站提供的Perl脚本还生成汇总文件,其中包含所识别的微卫星的位置和类型、不同重复类型的分布以及所识别的SSR基序的频率等信息。

GO项的赋值

使用Blast2GO对17599个ESTs进行了基因本体术语注释[30.].用blastx搜索将序列注释到GenBank非冗余数据库。对前20个命中值进行评估,blastx结果的e值截断值为1e6最小相似度为55%的注释使用了GO术语。基于默认证据代码权重的权重还用于确定注释的GO术语。使用InterProScan工具将序列与InterPro数据库进行比较,以识别蛋白质签名,从而获得更多信息和GO项[77].使用WEGO对GO项进行比较和可视化分析[31].

北方印迹分析

总rna (20 μg)在1.0% (w/v)琼脂糖/甲醛凝胶上分离,并转移到带正电的尼龙膜(Hybond™-N+, GE Healthcare Biosciences, UK),使用northnmax™试剂盒转移缓冲液(Ambion Inc., USA)向下毛细管转移。α标记的特异性探针32对相关差异表达克隆进行纯化PCR扩增,得到P-dCTP。3小时后prehybridization步骤中执行ULTRAhyb™(美国Ambion Inc .)和杂交一夜之间在同一个解决方案在65°C,细胞膜在2×盐水洗两次磷酸钠EDTA (SSPE) (0.36 M氯化钠,20毫米磷酸氢钠,2毫米EDTA) pH值7.4在室温下五分钟,然后在0.1×SSPE洗15分钟的65°C。污点是暴露在-80°C的加剧屏幕隔夜或1周。

参考文献

  1. 王刚,陈忠昌,苏亚平:油棕无性系的大规模繁殖-迄今的经验。学报(ISHS)。中国农业科学,2004,25(4):449 -658。

    文章谷歌学者

  2. Gorret N, Rosli SK, Oppenheimb SF, Willis LB, Lessard PA, Rha CK, Sinskey AJ:油棕生物反应器培养(Elaeis guineensis)以及氮源、接种量和条件培养基对生物量产量的影响。中国生物医学工程学报,2004,24(3):366 - 366。10.1016 / j.jbiotec.2003.12.009。

    PubMed文章谷歌学者

  3. Staritsky G:油棕榈组织培养(Elaies guineensis)作为其无性繁殖的工具。植物学报,1997,19(4):388 - 388。10.1007 / BF01904205。

    文章谷歌学者

  4. 李晓明,李晓明,李晓明,等:蜂窝状菌群èmbryos在体外棕榈胚胎的培养和胚胎(Elaeis guineensis组织叶的培养。巴黎科学研究院'Académie Série。1970, d283: 1735-1737。

    谷歌学者

  5. Cochard B, Durand-Gasselin T, Amblard P, Konan EK, Gogor S:油棕成体无性系的表现。下一个千年的新兴技术和机遇。农业会议:1999 PORIM国际棕榈油大会论文集:1999年2月1-6日;吉隆坡。编辑:Ariffin D, Chan KW. Sharifah SSA: PORIM;2000:53 - 64。

    谷歌学者

  6. 瓦希德MB,阿卜杜拉SNA,亨森IE:油棕榈的成就和潜力。植物学报,2005,8:288-297。10.1626 / pps.8.288。

    文章谷歌学者

  7. Rohani O, Sharifah SA, Rafii MY, Ong M, Tarmizi AH, Zamzuri I:油棕组织培养。油棕研究进展。编辑:Basiron Y, Jalani BS, Chan KW. Bangi:马来西亚棕榈油委员会;2000:238 - 283。

    谷歌学者

  8. 油棕胚状体的起源与发展Elaeis guineensis胚胎培养。ScienceAsia。1999, 25: 195-202。10.2306 / scienceasia1513-1874.1999.25.195。

    文章谷歌学者

  9. Corley RHV, Tinker PB:油棕。2003,牛津:Blackwell科学有限公司,4

    谷歌学者

  10. woi KC:油棕组织培养——当前的实践和制约因素。1993年iso opb油棕榈组织培养和生物技术最新发展国际研讨会论文集:1993年9月24日至25日;吉隆坡。编辑:Rao V, Henson IE。Rajanaidu N: PORIM;1995:21-32。

    谷歌学者

  11. Adams MD, Soares MB, Kerlavage AR, Fields C, Venter JC:从定向克隆的人类婴儿cDNA文库中快速测序(表达序列标签)。中国科学(d辑),1994,4:373-380。10.1038 / ng0893 - 373。

    PubMed文章谷歌学者

  12. Kawamoto S, Matsumoto Y, Mizuno K, Okubo K, Matsubara K:人类和小鼠肝脏中活性基因的表达谱。中国生物技术学报,1996,30(4):381 - 381。10.1016 / 0378 - 1119(96) 00512 - 4。

    PubMed文章谷歌学者

  13. Ronning CM、Stegalkina S、Ascenzi R、Bougri O、Hart A、utback T、Vanaken S、Reidmuller S、White J、Cho J、Karamycheva S、Pertea GM、Lee Y、Karamycheva S、Sultana R、Tsai J、Quackenbush J、Griffiths HM、Restrepo S、Smart CD、Fry WE、Hoeven van der R、Tanksley S、Zhang P、Jin H、Yamamoto M、Baker BJ、Buell CR:马铃薯表达序列标签库的比较分析。植物生理学报,2003,31(4):419-429。10.1104 / pp.013581。

    PubMed公共医学中心文章谷歌学者

  14. Jouannic S, Argout X, Lechauve F, Fizames C, Borgel A, Morcillo F, aberlen - bertossi F, Duval Y, Tregear J:油棕表达序列标签的分析(英文)Elaeis guineensis).中国科学(d辑:自然科学版)。10.1016 / j.febslet.2005.03.093。

    PubMed文章谷歌学者

  15. 何振林、关玉玉、崔明春、Tee S-S、吴炜华、林兆娥、李玉萍、黄淑娥、李炜玮、Tee J-M、Tan S-H、Kulaveerasingam H、Alwee SSRS、Abdullah MO:油棕多组织表达序列标签(ESTs)的分析与功能注释(Elaeis guineensisJacq)。中国生物医学工程学报,2007,26(3):381-10.1186/1471-2164-8-381。

    PubMed公共医学中心文章谷歌学者

  16. Legrand S, Hendriks T, Hilbert J-L, Quillet M-C:体细胞胚胎发生过程中SSH表达的序列标记的表征Cichorium intybus植物工程学报,2007,26(3):366 - 366。

    PubMed公共医学中心文章谷歌学者

  17. Schmidt EDL, Guzzo F, Toonen MAJ, de Vries SC:含有受体样激酶的富含亮氨酸重复序列标志着体细胞植物细胞具有形成胚胎的能力。《发展》1997,124:2049-2062。

    PubMed谷歌学者

  18. Wurtele ES, Wang H, Durgerian S, Nikolau BJ, Ulrich TH:在体细胞胚胎发生早期表达的一个基因的表征胡萝卜胡萝卜.植物生理学报,2003,24(3):354 - 354。10.1104 / pp.102.1.303。

    PubMed公共医学中心文章谷歌学者

  19. 斯特恩S,莫德霍斯特AP,富克斯S, Lörz H:大麦胚胎发生潜力和再生能力的分子和生化标记(大麦芽l)细胞培养。植物科学学报,1995,16(5):557 - 557。10.1016 / 0168 - 9452(95) 04084 - 8。

    文章谷歌学者

  20. van Engelen FA、de Jong AJ、Meijer EA、Kuil CW、Meyboom JK、Dirkse WG、Booij H、Hartog MV、Vandekerckhove J、de Vries SC、van Kammen A:胡萝卜悬浮细胞分泌47 kDa糖蛋白的纯化、免疫学特性及cDNA克隆植物生物学杂志,2003,21(3):391 - 391。10.1007 / BF00037018。

    PubMed文章谷歌学者

  21. Ikeda M, Umehara M, Kamada H:胚胎发生相关基因;它在胡萝卜体细胞和合子胚胎发生中的表达及其作用拟南芥.植物生物技术,2006,23:153-161。

    文章谷歌学者

  22. Carlton JM-R, Muller R, Yowell CA, Fluegge MR, Sturrock KA, Pritt JR, Vargas-Serrato E, Galinski MR, Barnwell JW, Mulder N, Kanapin A, Cawley SE, Hide WA, Dame JB:疟疾基因组图谱:三种疟疾寄生虫与其他ap复杂性物种比较的基因调查。中国生物医学工程学报,2001,29(4):447 - 447。10.1016 / s0166 - 6851(01) 00371 - 1。

    PubMed文章谷歌学者

  23. Hoeven van der R, Ronning C, Giovannoni J, Martin G, Tanksley S:基于对大量表达的序列标签收集和选择性基因组测序的分析,推断番茄基因组中基因的数量、组织和进化。植物学报,2002,14:1441-1456。10.1105 / tpc.010478。

    PubMed公共医学中心文章谷歌学者

  24. Abdullah SNA, Cheah SC, Murphy DJ:从油棕中分离出两种不同的3型金属硫蛋白,Elaeis guineesis.植物生理与生物化学,2002,40(4):563 - 566。10.1016 / s0981 - 9428(02) 01366 - 9。

    文章谷歌学者

  25. T:小麦胚芽Ec蛋白是一种含锌的金属硫蛋白。生物化学与细胞生物学杂志,1997,29(3):366 - 366。

    文章谷歌学者

  26. de Framond AJ:玉米金属硫蛋白样基因(玉米)克隆与表征。中国科学(d辑)。10.1016 / 0014 - 5793(91) 81236 - 2。

    PubMed文章谷歌学者

  27. Kawashima I, Kennedy TD, Chino M, Lane BG:小麦Ec金属硫蛋白基因。比如哺乳动物的锌2 +金属硫蛋白基因,小麦锌2 +金属硫蛋白基因在胚胎发生过程中显著表达。中国生物医学工程学报,1999,19(4):576 - 576。10.1111 / j.1432-1033.1992.tb17370.x。

    PubMed文章谷歌学者

  28. 锤DH:金属硫蛋白。中国生物医学工程学报,2003,23(5):533 - 536。

    PubMed文章谷歌学者

  29. Miller RT, Christoffels AG, Gopalakrishnan C, Burke J, Ptitsyn AA, Broveak TR, Hide WA:一种表达人类基因序列的综合聚类方法:序列标签对齐和共识知识库。基因组学报,1999,9:1143-1155。10.1101 / gr.9.11.1143。

    PubMed公共医学中心文章谷歌学者

  30. Conesa A, Götz S, García-Gómez JM, Terol J, Talón M, Robles M: Blast2GO:功能基因组学研究中注释、可视化和分析的通用工具。生物信息学,2005,21:3674-3676。10.1093 /生物信息学/ bti610。

    PubMed文章谷歌学者

  31. 叶军,方磊,郑华,张勇,陈俊,张铮,王俊,李松,李锐,Bolund L,王俊:WEGO:一种GO注释绘制web工具。核酸学报,2006,W293-W297。10.1093 / nar / gkl031。34 Web服务器

    PubMed公共医学中心文章谷歌学者

  32. Phillips RL, Kaepplert SM, Olhoft P:植物组织培养的遗传不稳定性:正常对照的破坏。中国生物医学工程学报,1994,29(4):366 - 366。10.1073 / pnas.91.12.5222。

    PubMed公共医学中心文章谷歌学者

  33. Sterky F、Regan S、Karlsson J、Hertzberg M、Rohde A、Holmberg A、Amini B、Bhalerao R、Larsson M、Villarroel R、van Montagu M、Sandberg G、Olssoni O、Teeri TT、Boerjan W、Gustafsson P、Uhlen M、Sundberg B、Lundeberg J:杨树成木组织基因的发现:5,692个表达序列标签的分析中国生物医学工程学报,1998,29(3):359 - 359。10.1073 / pnas.95.22.13330。

    PubMed公共医学中心文章谷歌学者

  34. Okubo K, Hori N, Matoba R, Niiyama T, Fukushima A, Kojima Y, Matsubara K:用于基因表达定量和定性分析的大规模cDNA测序。自然学报,1992,2:173-179。10.1038 / ng1192 - 173。

    PubMed文章谷歌学者

  35. Romualdi C, Bortoluzzi S, D'Alessi F, Danieli GA: IDEG6:用于检测多标记采样实验中差异表达基因的网络工具。中国生物医学工程学报,2003,29(4):359 - 361。

    PubMed文章谷歌学者

  36. Stekel DJ, Git Y, Falciani F:多个cDNA文库基因表达的比较。基因组学报,2000,10:2055-2061。10.1101 / gr.gr - 1325 rr。

    PubMed公共医学中心文章谷歌学者

  37. Nakamura Y, Gojobori T, Ikemura T:来自国际DNA序列数据库的密码子使用情况:2000年的状况。核酸学报,2000,28:292-10.1093/nar/28.1.292。

    PubMed公共医学中心文章谷歌学者

  38. Asamizu E, Nakamura Y, Sato S, Tabata S:从豆科植物中生成7137个非冗余表达序列标签,Lotus对虾.DNA学报,2000,7:127-130。10.1093 / dnares / 7.2.127。

    PubMed文章谷歌学者

  39. Sterky F, Bhalerao RR, Unneberg P, Segerman B, Nilsson P, Brunner AM, charbonnell - campaa L, Lindvall JJ, Tandre K, Strauss SH, Sundberg B, Gustafsson P, Uhlén M, Bhalerao RP, Nilsson O, Sandberg G, Karlsson J, Lundeberg J, Jansson S: A杨树植物功能基因组学的EST资源。中国生物医学工程学报,2004,31(4):359 - 359。10.1073 / pnas.0401641101。

    PubMed公共医学中心文章谷歌学者

  40. Duret L, Galtier N: TpA缺乏症、CpG缺乏症和人类同分异构体中G1C含量之间的协变是由一种数学人为因素造成的。中华分子生物学杂志,2000,17:1620-1625。

    PubMed文章谷歌学者

  41. Poncet V, Rondeau M, Tranchant C, Cayrel A, Hamon S, de Kochko A, Hamon P:咖啡树EST数据库中的SSR挖掘:EST- ssrs作为标记的潜在应用Coffea属。中国生物医学工程学报,2006,26(4):436-449。10.1007 / s00438 - 006 - 0153 - 5。

    文章谷歌学者

  42. Varshney RK, Graner A, Sorrells ME:植物基因微卫星标记的特征和应用。生物技术,2005,23:48-55。10.1016 / j.tibtech.2004.11.005。

    PubMed文章谷歌学者

  43. Kantety RV, Rota ML, Matthews DE, Sorrells ME:大麦、玉米、水稻、高粱和小麦表达序列标签中简单序列重复的数据挖掘。植物生理学报,2004,24(4):371 - 371。10.1023 /: 1014875206165。

    PubMed文章谷歌学者

  44. Varshney RK, Thiel T, Stein N, Langridge P, Graner A:在网上部分谷类植物est中微卫星的频率和分布分析。中国生物医学工程学报,2002,29(3):366 - 366。

    PubMed谷歌学者

  45. Thiel T, Michalek W, Varshney RK, Garner A:利用EST数据库开发和表征大麦基因衍生的ssr标记(大麦芽l .)。中国生物医学工程学报,2003,26(4):426 - 426。

    谷歌学者

  46. Nicot N, Chiquet V, Gandon B, Amilhat L, Legeai F, Leroy P, Bernard M, Sourdille P:小麦表达序列标签(est)中SSR标记的研究。中国科学(d辑),2004,38(4):559 - 561。10.1007 / s00122 - 004 - 1685 - x。

    PubMed文章谷歌学者

  47. Asp T, Frei UK, Didion T, Nielsen KK, Lubberstedt T:三种基因型的EST-SSRs的频率、类型和分布多年生黑麦草的同源序列之间的守恒性Brachypodium distachyon,栽培稻.植物学报,2007,7:36-10.1186/1471-2229-7-36。

    PubMed公共医学中心文章谷歌学者

  48. 双子叶植物表达序列标签中简单序列重复序列的挖掘与研究。中国生物技术学报,2005,48:985-998。10.1139 / g05 - 060。

    PubMed文章谷歌学者

  49. Lokko Y, Anderson JV, Rudd S, Raji A, Horvath D, Mikel MA, Kim R, Liu L, Hernandez A, Dixon AGO, Ingelbrecht IL:木薯18,166 EST数据集的表征(木薯耐Crantz)对干旱反应基因的富集。植物科学进展,2007,26:1605-1618。10.1007 / s00299 - 007 - 0378 - 8。

    PubMed文章谷歌学者

  50. 于建科,Dake TM, Singh S, Benscher D, Li W, Gill B, Sorrells ME:基于est的六倍体小麦简单序列重复标记的构建与定位。中国生物医学工程学报,2004,29(4):359 - 359。10.1139 / g04 - 057。

    PubMed文章谷歌学者

  51. stk P, Booij H, Schellekens GA, van Kammen A, de Vries SC:胡萝卜EP2脂质转移蛋白基因的细胞特异性表达。植物科学学报,1998,12(3):369 - 369。10.1105 / tpc.3.9.907。

    PubMed公共医学中心文章谷歌学者

  52. Coutos-Thevenot P、Jouenne T、Maes O、Guerbette F、Grosbois M、le Caer JP、Boulay M、Deloire A、Kader JC、Guern J:葡萄藤体细胞胚分泌的4种9-kDa蛋白是脂质转移蛋白的同亚型。中国生物医学工程学报,1994,25(3):366 - 366。10.1111 / j.1432-1033.1993.tb18317.x。

    PubMed文章谷歌学者

  53. 王峰,王峰,周宁,王峰,王峰,王峰,王峰,王峰,王峰,王峰,王峰,王峰,王峰芸苔属植物显著.植物生理学报,2004,24(3):354 - 354。10.1104 / pp.106.092932。

    PubMed公共医学中心文章谷歌学者

  54. 植物中的脂质转移蛋白。植物生理学报,1996,29(4):369 - 369。10.1146 / annurev.arplant.47.1.627。

    PubMed文章谷歌学者

  55. Neumann G, Condron R, Thomas I, Polya G:植物钙依赖性蛋白激酶磷酸化的小麦脂质转移蛋白同源物家族的纯化和测序。生物化学学报,1994,19(3):369 - 369。

    PubMed文章谷歌学者

  56. 曾峰,张铮,朱亮,涂亮,郭旭,聂燕:用抑制消减杂交和宏阵列分离棉花体细胞胚胎发生相关基因。植物生物学杂志,2006,30(4):366 - 366。10.1007 / s11103 - 005 - 3381 - x。

    PubMed文章谷歌学者

  57. 图拉耶夫A,韦森特O, Heberle-Bors E:胁迫启动小孢子胚胎发生。植物生态学报,1998,22(2):369 - 371。10.1016 / s1360 - 1385(97) 89951 - 7。

    文章谷歌学者

  58. Maraschin SF, de Priester W, Spaink HP, Wang M:雄性激素开关:雄性配子体视角下植物胚胎发生的一个例子。中国生物医学工程学报,2005,36(5):359 - 359。10.1093 / jxb / eri190。

    PubMed文章谷歌学者

  59. Shariatpanahi ME, Bal U, Heberle-Bors E, Touraev A:植物小孢子重编程所施加的应力在体外胚胎发生。植物工程学报,2006,29(5):519- 524。10.1111 / j.1399-3054.2006.00675.x。

    文章谷歌学者

  60. 张丽娟,张丽娟,张丽娟,等。植物芽、根和愈伤组织发育过程中的基因表达拟南芥组织文化。植物生理学报,2006,29(4):366 - 366。10.1104 / pp.106.081240。

    PubMed公共医学中心文章谷歌学者

  61. Papadakis AK, Siminis CI, Roubelakis-Angelakis KA:植物原生质体中抗氧化机制活性降低与全能性抑制相关。植物生理学报,2001,27(4):344 - 344。10.1104 / pp.126.1.434。

    PubMed公共医学中心文章谷歌学者

  62. Tregear JW, Morcillo F, Richaud F, Berger A, Singh R, Cheah SC, Hartman C, Rival A, Duval Y:油棕花序中表达的防御素基因的特性:在组织培养过程中的诱导及其与表观遗传体细胞无性变异事件的可能联系。中国生物医学工程学报,2002,32(3):369 - 369。10.1093 / jexbot / 53.373.1387。

    PubMed文章谷歌学者

  63. Ong-Abdullah M, Eng OS:生物标志物:在油棕组织培养中找到一个生态位。第一部分打好基础。油棕通报,2006,53:30-35。

    谷歌学者

  64. Galland R, Randoux B, Vasseur J, Hilbert JL: mRNA差异显示鉴定的谷胱甘肽- s -转移酶cDNA在体细胞胚胎发生过程中表达上调Cichorium.生物化学学报,2001,27(3):347 - 347。

    谷歌学者

  65. Kitamiya E, Suzuki S, Sano T, Nagata T:体细胞起始诱导的两个基因的分离高浓度2,4- d在胡萝卜下胚轴上的胚胎发生.植物细胞学报,2000,19:551-557。10.1007 / s002990050772。

    文章谷歌学者

  66. Dixon DP, Lapthorn A, Edwards R:植物谷胱甘肽转移酶。中国生物医学工程学报,2002,30(3):369 - 369。10.1186 / gb - 2002 - 3 - 3 - reviews3004。

    文章谷歌学者

  67. 田口盐原F、Yazaki J、石川M、藤井F、Shimbo K、Shimatani Z、Nagata Y、桥本A、Ohta T、佐藤Y、Honda S、山本K、坂田K、佐佐木T、岸本N、菊池S:覆盖与愈伤组织增殖相关qtl的水稻近等基因系微阵列分析。JARQ。2006, 40: 243-249。

    文章谷歌学者

  68. Thibaud-Nissen F, Shealy RT, Khanna A, Vodkin LO:聚类微阵列数据揭示了与大豆体细胞胚胎发生相关的转录模式。植物生理学报,2004,24(3):381 - 381。10.1104 / pp.103.019968。

    PubMed公共医学中心文章谷歌学者

  69. Rochester DE, Winter JA, Shah DM:玉米主要热休克蛋白hsp70编码基因的结构和表达。王志强。2011,26(5):455 -458。

    PubMed公共医学中心谷歌学者

  70. Singh R, Cheah SC:油棕榈花特异性蛋白的鉴定(Elaeis guineensis)进行双向凝胶电泳。油棕榈学报,2000,12:46-54。

    谷歌学者

  71. Ewing B, Hillier LAD, Wendl MC, Green P:使用自动序列跟踪的基调用phr.基因组学报,1998,8:175-185。

    PubMed文章谷歌学者

  72. Ewing B, Green P:使用phred的自动音序器跟踪的基调用。2错误概率。中国生物医学工程学报,1998,38(4):381 - 381。

    PubMed文章谷歌学者

  73. Burke J, Davison D, Hide W: d2_cluster:一种有效的EST和全长cDNA序列聚类方法。基因组学报1999,9:1135-1142。10.1101 / gr.9.11.1135。

    PubMed公共医学中心文章谷歌学者

  74. PHRAP。[http://www.phrap.org

  75. Chou A, Burke J: CRAWview:用于查看ESTs和全长序列簇中的剪接变异、基因家族和多态性。生物信息学,1999,15:376-381。10.1093 /生物信息学/ 15.5.376。

    PubMed文章谷歌学者

  76. 对剧中。[http://pgrc.ipk-gatersleben.de/misa/

  77. Zdobnov EM, Apweiler R: InterProScan - InterPro中特征识别方法的集成平台。生物信息学,2001,17:847-848。10.1093 /生物信息学/ 17.9.847。

    PubMed文章谷歌学者

下载参考

确认

作者感谢MPOB总干事允许发表这篇论文。作者也非常感谢Felda和Ebor研究中心,森达比为本文所述的研究提供植物材料,并感谢李翁华先生和koprime Pte Ltd.提供的生物信息学援助。还要特别感谢Mohd Noor Mat Isa先生帮助处理GenBank提交的序列。该项目由马来西亚科学、技术和创新部(MOSTI)的马来西亚-麻省理工学院生物技术伙伴计划(MMBPP)基金资助。

作者信息

从属关系

作者

相应的作者

对应到Rajinder辛格

额外的信息

作者的贡献

E-TLL、HA、C-YAT和LCLO构建cDNA文库,生成est。S-HB和EMS也参与EST测序。HA和E-TLL建立序列分析系统。E-TLL、S-HB、HA和EMS对ESTs进行分析。LCLO维护EST克隆。S-HB进行northern blot分析。E-TLL, HA和S-HB起草了手稿。S-CC、K-LW和RS参与研究设计。S-CC、A-RR、K-LW和RS对研究进行了监督和协调,并对手稿进行了批判性修改。所有作者阅读并批准了最终稿件。

电子补充材料

12870 _2007_270_moesm1_esm.pdf

附加文件1:从非胚性愈伤组织、胚性愈伤组织和胚状cDNA文库中分离的17599个ESTs的组装结果。(pdf 482 kb)

作者提交的图片原始文件

权利与权限

开放获取本文由BioMed Central Ltd.授权发布。这是一篇开放获取文章,根据创作共用授权协议(https://creativecommons.org/licenses/by/2.0),它允许在任何媒体上不受限制地使用、分发和复制,只要原著被恰当地引用。

转载及权限

关于本文

引用本文

低,ET.L。,Alias, H., Boon, SH.et al。油棕(Elaeis guineensis组织培养est:鉴定与胼胝体发生和胚胎发生相关的基因。植物生物学8日,62(2008)。https://doi.org/10.1186/1471-2229-8-62

下载引用

  • 收到了

  • 接受

  • 发表

  • DOIhttps://doi.org/10.1186/1471-2229-8-62

关键字

  • 基因本体论
  • 体细胞胚
  • 胚胎发生的愈伤组织
  • 简单序列重复母题
  • 脂质转移蛋白基因