0 引言
【研究意义】蜜蜂是重要的授粉昆虫和社会学模式昆虫,因其对研究神经生物学、发育、社会行为和表观基因组学的重要性而广受关注[1-4],西方蜜蜂(Apis mellifera)早在2006年就已完成基因组测序[5],为研究蜜蜂行为、遗传进化和基因功能提供了重要的信息和线索。与西方蜜蜂相比,东方蜜蜂(Apis cerana)更易适应极端天气、飞行距离更长、具有更强的梳理行为和清洁行为以及群体防御能力[6-9]。中华蜜蜂(Apis cerana cerana,简称中蜂)长期进化适应本土环境,相比于西方蜜蜂具有抗螨害、耐寒、善利用零星蜜粉源等优点[8-12]。利用RNA seq技术对中蜂幼虫肠道进行深度测序,de novo组装其参考转录组并进行功能及代谢通路注释,可为中蜂幼虫的分子及组学研究提供重要参考信息,在此基础上鉴定出的SSR分子标记可为在分子水平深入研究中蜂的重要性状、复杂行为及遗传进化提供宝贵信息。【前人研究进展】近年来,以RNA seq为代表的高通量测序技术发展迅猛,广泛应用于动植物及微生物研究[13-19],在蜜蜂研究方面也取得了一系列重要进展[20-21]。中国养蜂生产中的常见蜂种为意大利蜜蜂(Apis mellifera ligustica,简称意蜂)和中蜂。PARK等[22]通过对A. cerana雄蜂的基因组测序和对A. mellifera及A. cerana工蜂多个组织的转录组测序,获得238 Mb的基因组数据和10 651个基因信息,并对A. cerana特有基因进行了分析,但作者当时并未公布基因位置及功能注释信息。SSR分子标记开发的传统方法是通过构建基因组DNA文库,成本昂贵且费时费力,而利用高通量测序技术的新一代SSR鉴定则更为经济、高效[13-15]。梁勤等[23]利用6对微卫星DNA标记对福建省4个中蜂群体进行遗传多样性分析,评估群体内的遗传变异和群体间的遗传分化;徐新建等[24]应用10个微卫星DNA标记对海南岛11个地点和大陆2个地点中蜂分析表明,海南中蜂多样性丰富,岛屿和邻近大陆种群发生了明显的遗传分化。目前,已开发的中蜂SSR分子标记很少[25-26],制约了中蜂分子进化及种群遗传学的发展。【本研究切入点】东方蜜蜂的基因组已完成测序并公布,但缺乏专一的中蜂幼虫肠道参考转录组,严重制约中蜂幼虫的病原-宿主互作及免疫应答研究。【拟解决的关键问题】利用RNA seq数据组装并注释中蜂幼虫肠道参考转录组,并鉴定出若干SSR分子标记,解决中蜂幼虫参考转录组缺失以及SSR分子标记较少的问题。1 材料与方法
试验于2015年12月至2016年8月在福建农林大学蜂学学院蜜蜂保护学实验室完成。1.1 供试材料
中蜂幼虫取自福建农林大学蜂学学院教学蜂场,蜜蜂球囊菌(Ascosphaera apis)菌株保存于福建农林大学蜂学学院蜜蜂保护学实验室。1.2 主要试剂及仪器
RNase-free水购自中国上海生工生物公司;DNaseI和Oligotex mRNA Kits Midi试剂盒购自德国Qiagen公司;Dynal M280磁珠购自Invitrogen公司;高碘酸钠购自美国Sigma公司;DNA ligase购自美国Thermo公司;RNA Reagent抽提试剂盒、Ex Taq polymerase及Superscript II reverse transcriptase均购自日本TaKaRa公司;纯化cDNA的Ampure beads为美国Agencourt产品;cDNA文库构建试剂盒TruSeqTMDNA Sample Prep Kit -Set A为美国Illumina公司产品。其他试剂均为国产分析纯。恒温恒湿气候箱购自中国宁波江南仪器厂;pH计购自中国上海仪电科学股份有限公司;超纯水仪购自中国四川沃特尔水处理设备有限公司;高速冷冻离心机购自德国Eppendorf公司;倒置显微镜为中国上海光学仪器五厂产品;超净工作台为中国苏州安泰空气技术有限公司产品;PCR仪为美国Bio Rad公司产品;凝胶成像系统为中国上海培清科技有限公司产品;超低温冰箱为中科美菱低温科技股份有限公司产品。
1.3 方法
1.3.1 幼虫的人工饲养 中蜂幼虫的人工饲料参照王倩等[26]的方法配制并改良,将D-果糖和D-葡萄糖换为新鲜蜂蜜。预试验中对照组中蜂幼虫7日龄成活率达到70%以上。从福建农林大学蜂学学院蜂场选择经PCR检测为球囊菌阴性的健康蜂群。用灭菌的移虫针挑取2日龄幼虫,放入无菌的24孔细胞培养板(每孔对应1只幼虫,孔内加有35℃预温的幼虫饲料),将24孔板放入恒温恒湿培养箱,每隔24 h吸去旧饲料、加入新饲料。3日龄时,一组幼虫饲喂含有球囊菌孢子(1×107孢子/mL)的人工饲料,另一组幼虫饲喂以正常人工饲料。35℃,90% RH条件下饲喂幼虫至7日龄,上述两组幼虫组均设置3个生物学重复。1.3.2 测序样品准备 分别于4、5、6日龄剖取中蜂幼虫肠道组织,为尽量减少肠道RNA的降解,将从解剖取样到样品放入液氮速冻的时间控制在30 s以内,每剖取一组样品,液氮速冻后迅速放入-80℃超低温冰箱保存。
1.3.3 cDNA文库构建及RNA seq 利用RNAiso Reagent试剂盒抽提中蜂幼虫肠道组织的总RNA,然后用RNase-free DNaseI去除基因组DNA残留。RNA的质量通过琼脂糖凝胶电泳和NanoDrop ND-2000(NanoDrop,Wilmington,DE,USA)进行检测。利用Oligotex mRNA Kits Midi试剂盒说明书,纯化各样品总RNA中的mRNA。以10 μg mRNA作为模板,GsuI-oligo dT作为反转录引物,用1 000 U Superscript II reverse transcriptase在42℃下孵育1 h合成第1链cDNA;随后利用高碘酸钠氧化mRNA的5′端帽子结构,并连接生物素;通过Dynal M280磁珠筛选连接了生物素的mRNA/cDNA,并通过碱裂解释放第1链cDNA;然后通过DNA ligase在第1链cDNA 的5′末端加上接头,利用Ex Taq polymerase合成第2链cDNA。最后,通过GsuI酶切去除polyA和5′端接头。利用Ampure beads对上述cDNA进行纯化,cDNA文库通过TruSeqTM DNA Sample Prep Kit-Set A进行构建和TruSeq PE Cluster Kit进行扩增。委托广州基迪奥生物技术有限公司对上述12个肠道样品进行深度测序,测序平台为Illumina Hiseq 2500,各肠道样品的3个生物学重复均同时进行测序。
1.3.4 中蜂幼虫肠道参考转录组的de novo组装 首先,利用Perl脚本去除含有adaptor、未知核苷酸比例>5%和低质量reads,获得clean reads。利用软件Trinity[27]进行中蜂转录组的de novo组装(缺省值Kmer=25)。长度短于200 bp的contigs和unigenes将被舍弃。过滤和组装以后得到高质量的unigenes。
1.3.5 Unigenes注释 利用BLASTx(E-value<10-5)将测序序列比对NCBI nr数据库(http://www.ncbi.nlm.nih.gov)、Swiss-Prot 数据库(http://www.expasy.ch/sprot)、KOG(Clusters of orthologous groups for eukaryotic complete genomes)数据库(ftp://ftp.ncbi.nih.gov/pub/COG/KOG/kyva)和KEGG代谢通路(pathway)数据库(http://www.genome.jp/kegg/)。利用BLASTX将组装出来的unigenes序列与Nr数据库进行比对后,取每个unigenes在Nr库中比对结果最好(E值最低)的那一条序列为对应同源序列(如有并列,取第一条)确定同源序列所属物种,统计比对到各个物种的同源序列数量。基于Nr database注释结果,利用Blast2GO进行unigenes的GO注释,利用WEGO软件对每一个转录本进行GO分类。
1.3.6 SSR分子标记开发 利用软件MISA(http:// pgrc.ipk-gatersleben.de/misa/)搜索unigenes的微卫星标记,按照以下标准从unigenes中查找SSR位点:二核苷酸重复≥6次,三核苷酸重复≥5次,四核苷酸重复≥5次,五核苷酸重复≥5次和六核苷酸重复≥5次。根据MISA的输出结果,利用Primer Premier 5(PREMIER Biosofe Int.,Palo Alto,CA)对每一个含有16 bp碱基重复的SSR设计引物。
选取北京(B)、辽宁兴城(L)、四川成都(S)3个不同来源的中蜂幼虫肠道样本作为模板,随机选取20对SSR引物进行PCR扩增,PCR程序:94℃预变性5 min;94℃变性50 s,55℃退火30 s,72℃延伸30 s,共33个循环,72℃再延伸10 min。PCR产物经1%琼脂糖凝胶电泳检测。
2 结果
2.1 中蜂幼虫肠道的RNA seq及参考转录组de novo组装
对上述12个肠道样品进行Illumina测序,平均得到30 584 420条原始读段(raw reads),去除低质量和含有接头的reads后平均获得29 726 139条有效读段(clean reads),总测序长度为3 715 767 396,Q20平均为98.31%,说明测序数据质量较好,可用于下一步分析。各样品的测序详细信息如附表1所示。Table S1
附表 1
附表 1过滤前后碱基信息统计表
Table S1Characteristics of bases before and after filtration
样本 Sample | 过滤前Before filtration | 过滤后After filtration | ||||
---|---|---|---|---|---|---|
过滤前数据 Data before filtration (bp) | 质量值为20的 数据百分比 Q20 (%) | 质量值为30的 数据百分比 Q30 (%) | 过滤后数据 Data after filtration (bp) | 质量值为20的 数据百分比 Q20 (%) | 质量值为30的 数据百分比 Q30 (%) | |
AcCK-1 | 4191778750 | 4122004862 (98.34%) | 4030429418 (96.15%) | 4120582000 | 4064246549 (98.63%) | 3979833851 (96.58%) |
AcCK-2 | 4334195500 | 4213996428 (97.23%) | 4077228759 (94.07%) | 4160134000 | 4083143848 (98.15%) | 3965993864 (95.33%) |
AcCK-3 | 3586255750 | 3521454328 (98.19%) | 3438794473 (95.89%) | 3519954500 | 3468760601 (98.55%) | 3393319631 (96.40%) |
AcT1-1 | 3553351500 | 3451094311 (97.12%) | 3335859989 (93.88%) | 3405554750 | 3340447479 (98.09%) | 3242098346 (95.20%) |
AcT1-2 | 3893773250 | 3787923084 (97.28%) | 3667212827 (94.18%) | 3741024750 | 3672494334 (98.17%) | 3568820941 (95.40%) |
AcT1-3 | 3997812500 | 3872456664 (96.86%) | 3736549940 (93.46%) | 3813806000 | 3736163317 (97.96%) | 3622084861 (94.97%) |
AcT2-1 | 3712367500 | 3645843238 (98.21%) | 3556475695 (95.80%) | 3643512000 | 3588525599 (98.49%) | 3505311512 (96.21%) |
AcT2-2 | 3367244250 | 3299992256 (98.00%) | 3211236465 (95.37%) | 3305180000 | 3250516762 (98.35%) | 3168526789 (95.87%) |
AcT2-3 | 3456114000 | 3391514363 (98.13%) | 3305319508 (95.64%) | 3394594250 | 3341561175 (98.44%) | 3261515432 (96.08%) |
AcT3-1 | 3955549750 | 3852320596 (97.39%) | 3730784980 (94.32%) | 3813542000 | 3745784753 (98.22%) | 3640301441 (95.46%) |
AcT3-2 | 3382756500 | 3312883983 (97.93%) | 3223515743 (95.29%) | 3313704750 | 3258324213 (98.33%) | 3176565510 (95.86%) |
AcT3-3 | 4445430000 | 4358157898 (98.04%) | 4244135651 (95.47%) | 4357619750 | 4287478600 (98.39%) | 4182386252 (95.98%) |
新窗口打开
对clean reads进行进一步序列拼接和去冗余处理,组装得到43 557条unigenes,平均长度达898 nt,N50为1 704 nt(表1)。统计结果显示,unigenes的数目随着序列长度的增加而减少,在200—299 nt长度范围内数目最多,符合生物体序列长度分布的基本规律。长度>1 000 nt的unigenes有10 454条,占总unigenes的24.00%。上述结果说明中蜂幼虫肠道的组装质量较好。转录组测序数据已上传NCBI SRA数据库,SRA号:SRA456721。
Table 1
表1
表1中蜂幼虫肠道参考转录组组装结果统计
Table 1Summary of A. c. cerana larval gut’s reference transcriptome assembled in this study
基因数目 Genes number | GC百分比 GC percentage (%) | 居中长度 N50 | 最长长度 Max length | 最短长度 Min length | 平均长度 Average length | 总长度 Total assembled bases |
---|---|---|---|---|---|---|
43557 | 37.10 | 1704 | 22162 | 201 | 898 | 39117009 |
新窗口打开
2.2 Unigenes注释
利用BLASTx(E-value<10-5)将测序序列比对NCBI Nr、Swiss-Prot、KOG和KEGG pathway数据库,结果显示分别有17 456、12 830、11 442和9 045个unigenes能够注释到上述数据库,有功能或代谢通路注释的unigenes数目为18 225,占全部unigenes的41.84%,此外,有58.16%的unigenes无功能注释(表2)。有29个unigenes在4大数据库均有注释,而仅能注释到NCBI Nr、Swiss-Prot、KOG和KEGG pathway数据库的unigenes分别为3 899、443、37和10个。Table 2
表2
表2公共蛋白数据库注释统计表
Table 2Summary of annotation information of all unigenes in public protein databases
Unigene总数 Unigene number | Nr数据库 NCBI Nr database | Swiss- Prot数据库 Swiss-Prot database | KOG数据库 KOG database | KEGG数据库 KEGG database | 注释基因数 Annotated gene |
---|---|---|---|---|---|
43557 | 17456 | 12830 | 11442 | 9045 | 18225 |
新窗口打开
注释到Nr数据库中unigenes的E-value分布显示(图1),比对到物种序列的E-value均<10-5,其中E-value<10-100的有49.76%,说明比对结果可信度较高。注释基因同源序列的物种分布统计结果显示前10位的物种依次为Apis mellifera、Apis dorsata、Apis florea、Bombus impatiens、Bombus terrestris、Lasius niger、Megachile rotundata、Harpegnathos saltator、Capsaspora owczarzaki ATCC 30864和Cerapachys biroi,注释到A. mellifera的基因数为5 753(31.57%),注释到A. dorsata和A. florea的基因数分别为3 695(20.27%)和2 489(13.66%)(表3)。
显示原图|下载原图ZIP|生成PPT
图1E值分布
-->Fig.1Distribution of E-value in four databases
-->
Table 3
表3
表3Unigenes的物种分布统计表(前10位)
Table 3Unigenes distribution in different species (top 10 species)
物种 Species | Unigenes数量 Unigene number |
---|---|
西方蜜蜂Apis mellifera | 5753 |
大蜜蜂Apis dorsata | 3695 |
小蜜蜂Apis florea | 2489 |
凤仙花熊蜂Bombus impatiens | 319 |
欧洲熊蜂Bombus terrestris | 313 |
黑褐草蚁Lasius niger | 309 |
苜蓿切叶蜂Megachile rotundata | 291 |
印度跳蚁Harpegnathos saltator | 173 |
变形虫ATCC 30864 Capsaspora owczarzaki ATCC 30864 | 163 |
毕氏粗角猛蚁Cerapachys biroi | 156 |
新窗口打开
KOG注释结果显示,11 442个unigenes分布于25个基因家族(图2)。其中,注释基因数最多的为信号转导机制,其次为一般功能预测和翻译后修饰、蛋白翻转和分子伴侣。值得注意的是,有170条unigenes注释到防御机制,它们可能在中蜂幼虫抵御病原入侵过程发挥重要作用。
显示原图|下载原图ZIP|生成PPT
图2Unigenes的KOG功能分类A:RNA加工和修饰RNA processing and modification;B:染色质结构与动力学Chromatin structure and dynamics;C:能量产生和转换 Energy production and conversion;D:细胞周期调控、细胞分裂、染色体Cell cycle control, cell division, chromosome partitioning;E:氨基酸运输和代谢 Amino acid transport and metabolism;F:核苷酸运输和代谢 Nucleotide transport and metabolism;G:碳水化合物的运输和代谢Carbohydrate transport and metabolism;H:辅酶运输和代谢Coenzyme transport and metabolism;I:脂质运输和代谢Lipid transport and metabolism;J:翻译、核糖体结构和生物合成Translation, ribosomal structure and biogenesis;K:转录Transcription;L:复制、重建和修复Replication, recombination and repair;M:细胞壁/细胞膜/膜结构的生物合成Cell wall/membrane/envelope biogenesis;N:细胞运动Cell motility;O:翻译后修饰、蛋白质周转、伴侣Posttranslational modification, protein turnover, chaperones;P:无机离子转运与代谢Inorganic ion transport and metabolism;Q:次生代谢产物的合成、转运和代谢Secondary metabolites biosynthesis, transport and catabolism;R:一般功能预测General function prediction only;S:未知功能Function unknown;T:信号转导机制Signal transduction mechanisms;U:胞内运输、分泌和囊泡运输Intracellular trafficking, secretion, and vesicular transport;V:防御机制Defense mechanisms;W:细胞外结构Extracellular structures;Y:核结构Nuclear structure;Z:细胞骨架Cytoskeleton
-->Fig.2KOG classification of unigenes
-->
2.3 Unigenes的Gene Ontology(GO)分类
对所有unigenes进行GO分类,共有9 679个unigenes具有GO功能注释,这些基因的功能分为生物学过程、细胞组分和分子功能3类。如图3所示,生物学进程中,注释到行为、生物黏附、生物调控、细胞杀伤、细胞成分组织或生物合成、细胞进程、生长、免疫系统进程、定位、运动、代谢进程多组织进程、多细胞组织进程、生殖、生殖进程、应激、信号、单一有机体进程的unigenes数目分别为22、92、1 655、2、519、4 156、7、16、1 132、36、4 146、52、220、25、31、819、593和3 263个;细胞组分中,注释到细胞、细胞连接、细胞零、细胞外基质、细胞外基质组分、胞外区、胞外区零件、大分子复合物、细胞膜、细胞膜零件、细胞膜内腔、细胞器、细胞器零件、突触、突触零件、病毒、病毒零件的unigenes数目分别为2 900、15、2 900、39、6、27、26、1 287、1 702、1 511、65、1 893、700、41、37、49和49;分子功能中,注释到抗氧化活性、结合、催化活性、通道调节子活性、电子转运活性、酶调节活性、脒基核苷酸交换因子活性、分子功能调节因子、分子转换器活性、核酸结合转录因子活性、蛋白结合转录因子活性、结构分子活性、转运子活性的unigenes数目分别为48、4 935、2、34、89、61、150、316、177、30、402和521。显示原图|下载原图ZIP|生成PPT
图3Unigenes的GO分类1:行为Behavior;2:生物黏附Biological adhesion;3:生物调控Biological regulation;4:细胞杀伤Cell killing;5:细胞成分组织或生物合成Cellular component organization or biogenesis;6:细胞进程Cellular process;7:发育进程 Developmental process;8:生长Growth;9:免疫系统进程Immune system process;10:定位Localization;11:运动Locomotion;12:代谢进程Metabolic process;13:多组织进程Multi-organism process;14:多细胞组织进程Multicellular organismal process;15:生殖Reproduction;16:生殖进程Reproductive process;17:应激Response to stimulus;18:信号Signaling;19:单一有机体进程Single-organism process;20:细胞Cell;21:细胞连接Cell junction;22:细胞零件Cell part;23:细胞外基质Extracellular matrix;24:细胞外基质组分Extracellular matrix component;25:胞外区Extracellular region;26:胞外区零件Extracellular region part;27:大分子复合物Macromolecular complex;28:细胞膜Membrane;29:细胞膜零件Membrane part;30:细胞膜内腔Membrane-enclosed lumen;31:细胞器Organelle;32:细胞器零件Organelle part;33:突触Synapse;34:突触零件Synapse part;35:病毒Virion;36:病毒零件Virion part;37:抗氧化活性Antioxidant activity;38:结合Binding;39:催化活性Catalytic activity;40:通道调节子活性Channel regulator activity;41:电子转运活性Electron carrier activity;42:酶调节活性Enzyme regulator activity;43:脒基核苷酸交换因子活性Guanyl-nucleotide exchange factor activity;44:分子功能调节因子Molecular function regulator;45:分子转换器活性Molecular transducer activity;46:核酸结合转录因子活性Nucleic acid binding transcription factor activity;47:蛋白结合转录因子活性Protein binding transcription factor activity;48:结构分子活性Structural molecule activity;49:转运子活性Transporter activity
-->Fig.3GO classification of all unigenes
-->
2.4 Unigenes的KEGG代谢通路注释
对所有unigenes进行KEGG代谢通路注释,共有4 517个unigenes注释到KEGG数据库中,这些unigenes的通路信息如图4所示。这些unigenes分布于216个已知的代谢通路中,其中富集数量最多的10个代谢通路是核糖体、碳代谢以及内质网蛋白加工、内吞、RNA转运、嘌呤代谢、氧化磷酸化、剪接体、氨基酸生物合成和泛素介导的蛋白水解(表4)。此外,注释到溶酶体、MAPK信号通路、Jak-STAT信号通路、昆虫激素生物合成、黑化作用、Ras信号通路、凋亡和嗅觉转化上的unigenes分别为119、27、25、16、10、7、4和4个,其中富集在免疫通路上的unigenes有可能在中蜂幼虫响应病原微生物入侵的免疫应答过程中发挥关键作用。显示原图|下载原图ZIP|生成PPT
图4Unigenes的KEGG代谢通路注释A:代谢Metabolism;A1:碳水化合物代谢Carbohydrate metabolism;A2:氨基酸代谢Amino acid metabolism;A3:总览Global and overview;A4:脂质代谢Lipid metabolism;A5:能量代谢 Energy metabolism;A6:核苷酸代谢Nucleotide metabolism;A7:聚糖生物合成和代谢Glycan biosynthesis and metabolism;A8:辅助因子和维生素代谢Metabolism of cofactors and vitamins;A9:其他氨基酸代谢Metabolism of other amino acids;A10:外源性物质降解和代谢Xenobiotics biodegradation and metabolism;A11:萜类化合物和聚酮化合物代谢Metabolism of terpenoids and polyketides;A12:其他二级代谢的生物合成Biosynthesis of other secondary metabolites;B:遗传信息处理Genetic information processing;B1:翻译Translation;B2:折叠、分选和讲解Fold, sorting and degradation;B3:转录Transcription;B4:复制和修复Replication and repair;C:环境信息处理Environmental information processing;C1:信号转导Signal transduction;C2:信号分子及互作Signal molecules and interaction;C3:膜运输 Membrane transport;D:细胞进程Cellular processes;D1:运输和分解代谢Transport and catabolism;D2:细胞群体Cellular community;D3:细胞生长和死亡Cell growth and death;D4:细胞运动Cell motility;E:生物系统Organism systems;E1:衰老Aging;E2:内分泌系统Endocrine system;E3:发育Development;E4:感觉系统Sensory system;E5:免疫系统Immune system;E6:消化系统Digestive system;E7:循环系统Circulatory system;E8:神经系统Nervous system;E9:环境适应性Environment adaptation;E10:排泄系统Excretory system;F:人类疾病Human diseases; F1:内分泌代谢疾病Endocrine and metabolic diseases;F2:传染性疾病Infectious diseases;F3:癌症Cancers;F4:神经退行性疾病Neurodegenerative diseases;F5:物质依赖Substance dependence;F6:免疫疾病Immune diseases;F7:心血管疾病Cardiovascular diseases
-->Fig.4KEGG pathway annotation of all unigenes
-->
Table 4
表4
表4注释到KEGG数据库前10位代谢通路
Table 4Top 10 pathways of unigenes annotated in KEGG pathway database
代谢通路 Pathway | 基因数目 Gene number (4517) | 代谢通路ID Pathway ID |
---|---|---|
核糖体Ribosome | 385 (8.41%) | ko03010 |
碳代谢Carbon metabolism | 270 (5.9%) | ko01200 |
内质网蛋白加工 Protein processing in endoplasmic reticulum | 234 (5.11%) | ko04141 |
内吞Endocytosis | 217 (4.74%) | ko04144 |
RNA转运RNA transport | 210 (4.59%) | ko03013 |
嘌呤代谢Purine metabolism | 207 (4.52%) | ko00230 |
氧化磷酸化 Oxidative phosphorylation | 205 (4.48%) | ko00190 |
剪接体Spliceosome | 201 (4.39%) | ko03040 |
氨基酸生物合成 Biosynthesis of amino acids | 170 (3.71%) | ko01230 |
泛素介导蛋白水解 Ubiquitin mediated proteolysis | 146 (3.19%) | ko04120 |
新窗口打开
2.5 SSR分子标记鉴定
利用MISA软件从43 557条 unigenes中共鉴定出13 448个SSR位点。其中二核苷酸重复最多,数目达到7 804(58.03%),其次依次为三核苷酸、四核苷酸、五核苷酸和六核苷酸重复,数目分别为3 797(28.23%)、1 307(9.72%)、339(2.52%)和201 (1.49%)(表5)。通过对SSR基元进行分析,发现AT/AT出现的频率最高(30.4%),其次为AG/CT(22%),不同类型的SSR在总SSR中所占的比例如图5所示。Table 5
表5
表5中蜂幼虫肠道SSR位点统计
Table 5Characteristics of SSRs in A. c. cerana larval gut
统计项目Statistical item | 数量Number |
---|---|
序列总数Total number of sequences examined | 43557 |
序列的总长Total size of examined sequences | 39117009 |
SSR位点总数Total number of identified SSRs | 13448 |
含SSR位点的序列数 Number of SSR containing sequences | 7763 |
含1个以上SSR序列数 Number of sequences containing more than one SSR | 2793 |
复合型SSR位点数 Number of SSRs present in compound formation | 2347 |
二核苷酸重复SSR位点数Di-nucleotide | 7804 |
三核苷酸重复SSR位点数Tri-nucleotide | 3797 |
四核苷酸重复SSR位点数Tetra-nucleotide | 1307 |
五核苷酸重复SSR位点数Penta-nucleotide | 339 |
六核苷酸重复SSR位点数Hexa-nucleotide | 201 |
新窗口打开
显示原图|下载原图ZIP|生成PPT
图5不同串联重复单元类型的SSR在总SSR中所占比例
-->Fig.5Frequency of SSR motif in total SSRs
-->
在上述的13 448个SSR位点中,利用Primer Primer 5软件在随机挑选的20个SSRs序列两侧设计特异性引物,引物序列信息如附表2所示。提取4、5、6日龄中蜂幼虫肠道总DNA,等摩尔混合作为模板进行PCR扩增。
Table S2
附表 2
附表 2PCR扩增有条带的SSR位点引物序列
Table S2Primers of SSR loci that can be amplified by PCR
引物名称Primer name | 引物序列Primer sequence |
---|---|
Uni9-F | 5′-GCGAGCTCGAATTTGGATAA-3′ |
Uni9-R | 5′-GAACGTCTCTCGTCTCCCAG-3′ |
Uni11-F | 5′-GAGTGCCCTGTGAGAGCAG-3′ |
Uni11-R | 5′-CAAACACGTCACACTTTGGG-3′ |
Uni14-F | 5′-ATTCAACAGCAGCAGCAACA-3′ |
Uni14-R | 5′-CGTTCAGCTGTTGGAACGTA-3′ |
Uni16-F | 5′-GTTCGCGACGAGTTTCTCTC-3′ |
Uni16-R | 5′-GAGATGGGGATTGGAATTGA-3′ |
Uni19-F | 5′-TCATCCCTCGATAAGTTGGG-3′ |
Uni19-R | 5′-CAAATACGCATTTCCCGAAT-3′ |
Uni20-F | 5′-GAAACGTAATCCGACCGAGA-3′ |
Uni20-R | 5′-CATGATGAACGTATCAGCGG-3′ |
新窗口打开
PCR产物经1%琼脂糖凝胶电泳检测,结果显示,有6对SSRs特异性引物(SSR9、SSR11、SSR14、SSR16、SSR19、SSR20)对3个不同来源的中蜂幼虫肠道样品都扩增出了具有多态性的特异性条带(图6),说明这些SSR位点有望作为中蜂幼虫特有的分子标记,基于转录组数据大规模开发SSR分子标记具有良好的前景。
3 讨论
2015年,韩国的研究人员公布了东方蜜蜂雄蜂的基因组信息,但当时并没有公布基因的位置及功能注释信息[22]。WANG等[16]曾对中蜂进行过转录组测序,因测序组织包括3日龄工蜂幼虫、1日龄工蜂蛹、1日龄成年工蜂、采集蜂以及哺育蜂,故该转录组信息显示原图|下载原图ZIP|生成PPT
图6国内3个来源中蜂幼虫肠道SSR位点鉴定M:2000 bp ladder;B:北京来源的中蜂幼虫样品Larvae sample from Beijing;L:来源于辽宁兴城的幼虫样品Larvae sample from Xingcheng, Liaoning;S:来源于四川成都的幼虫样品Larvae sample from Chengdu, Sichuan
-->Fig.6SSR loci identification of A. c. cerana larval gut samples from three different regions in China
-->
较为复杂、不够专一。肠道是中蜂幼虫的主要免疫器官,在抵御病原微生物入侵过程中扮演着重要角色。本研究利用RNA seq技术对中蜂肠道进行深度测序,成功组装并注释了专一的中蜂幼虫肠道参考转录组,将有力推动中蜂及其幼虫的分子及组学研究,如中蜂幼虫响应球囊菌或东方蜜蜂微孢子虫(Nosema ceranae)侵染过程中的免疫应答及分子调控研究。
养蜂生产中,意蜂幼虫易被球囊菌感染而罹患白垩病[28],而中蜂幼虫具有较强的球囊菌抗性,但偶尔可见患病幼虫。通常认为中蜂具有较强的清理行为,表现出更强的群体防御[7],但中蜂幼虫个体水平的免疫防御却鲜有研究,其在中蜂幼虫球囊菌抗性方面所发挥的作用值得深入探讨。未来笔者课题组将在本研究组装并注释的参考转录组的基础上,对病原胁迫过程中中蜂幼虫的病原-宿主互作机制、免疫应答机制及分子调控机制进行深入系统的研究。
SSR分子标记的传统开发方法是通过构建DNA文库进行筛选,成本高且效率低,而高通量测序技术的应用为大规模筛选SSR分子标记带来曙光[15]。目前,已报道的中蜂SSR分子标记非常少[24-25],严重阻碍中蜂的品种鉴定及遗传进化等研究。本研究基于中蜂幼虫肠道的转录组数据预测潜在的SSR分子标记,随机选取的20对特异性SSR引物中有6对可在北京、辽宁兴城和四川成都3个不同来源的中蜂幼虫样品中扩增出具有多态性的片段,这些新开发的SSR分子标记有助于中蜂的基因图谱构建、基因多样性分析、基因定位等[29-30]研究的深入开展,说明基于转录组测序数据大规模开发SSR分子标记具有良好的应用前景。
4 结论
成功组装中蜂幼虫肠道参考转录组并对其进行了功能及代谢通路注释,可为中蜂幼虫的分子及组学研究提供重要的参考信息,也可用于补充、丰富和检验已公布的东方蜜蜂基因组,基于该转录组数据开发出的6个中蜂的SSR分子标记可应用于中蜂的基因图谱构建、基因多样性分析、基因定位等研究,同时也说明利用转录组数据开发非模式生物SSRs的方法可行。The authors have declared that no competing interests exist.