0 引言
【研究意义】熊蜂属于膜翅目蜜蜂科昆虫,是蜜蜂的近缘物种,在维持自然生态系统平衡和农业生产中发挥重要的作用[1-2]。兰州熊蜂(Bombus lantschouensis)是中国近年筛选出的优良蜂种,由于其易于人工饲养、蜂群群势大、温驯等优势,在设施作物授粉方面有较大的应用潜力[3]。嗅觉在昆虫感知外界环境、群内成员信息交流以及社会行为等方面都起到十分重要作用[4]。气味受体在嗅觉反应中起关键作用,其介导的气味分子与嗅觉神经元的专一性结合是昆虫嗅觉识别的重要基础[5-6]。因此,研究熊蜂中气味受体基因,对进一步了解气味受体在嗅觉反应中的作用具有重要意义。【前人研究进展】昆虫拥有复杂的嗅觉系统使其能够对外界环境进行识别,从而影响觅食、繁殖、群集及躲避敌害等行为[7]。在昆虫嗅觉识别的过程中有多种蛋白参与,主要包括气味结合蛋白(odorant binding proteins,OBPs)、气味受体(odorant receptors,Ors)、化学感受蛋白(chemosensory proteins,CSPs)以及感觉神经元膜蛋白(sensory neuronmembrane proteins,SNMPs)等[8],这些嗅觉蛋白中Ors是嗅觉识别过程中关键成分。当环境中气味分子通过昆虫嗅觉感受器表皮上的微孔进入感受器腔中,与OBP或是CSPs形成复合体,然后被运送到嗅觉神经元树突膜上与SNMPs和Ors相互作用,引起动作电位,从而传入中枢神经控制昆虫产生特定的生理与行为反应[9]。昆虫的气味受体为7次跨膜蛋白,其N端位于细胞膜内而C端位于膜外[6,10],嗅觉传导信号过程与传统G蛋白偶联受体不同,是一种独特的离子门控传递方式[11-12]。昆虫的嗅觉神经元一般表达两类气味受体:一类是传统气味受体,可以识别气味分子和信息素,在不同昆虫中同源性很低,具有高度的多样性;另一类受体在不同昆虫之间保守,不感受气味,与大多数传统气味受体共表达,称为非典型气味受体Orco(olfactory receptor co-receptor)[4,13]。由于嗅觉在参与昆虫取食、繁殖以及个体之间信息交流中都发挥着重要作用,因此了解嗅觉在昆虫活动中发挥的作用以及调控机制尤为重要。自BUCK等[14]在褐家鼠(Rattus norvegicus)中发现嗅觉受体蛋白家族之后,在多种生物中都发现了气味受体,昆虫中气味受体家族的鉴定,直到1999年黑腹果蝇(Drosophila melanogaster)基因组测序后,在其基因组中鉴定出62个Ors基因[15]。随后在冈比亚按蚊(Anopheles gambiae)中鉴定到79个Ors[16],家蚕(Bombyx mori)中有60个[17-19]。在膜翅目昆虫中,Or家族相对于果蝇与蚊类发生了扩展,目前在金小峰(Nasonia wasps)中发现300个Ors [20],在蚂蚁(Linepithema humile等)中甚至达到400个[21-24],在与熊蜂亲缘关系较近的意大利蜜蜂(Apis mellifera ligustica)中共发现170个Ors,其中7个为假基因,系统发育分析表明,这170个Ors分为5个亚家族,包含4个小亚家族和1个大亚家族(包含157个Ors)[25]。研究表明AmOr 151与AmOr 152在雌性蜂中具有较高的表达量,而且已被鉴定与花香气味分子靶定,AmOr 151主要靶标为大多数植物释放的芳香醇气味分子[26]。最近在小蜜蜂(Apis florea)的基因组中鉴定获得180个Ors,与意大利蜜蜂中的Ors序列十分相似,在小蜜蜂中还发现了一些与蜜蜂非同源的Ors和独立的假基因,说明在这两个物种的Ors进化中发生了分离[27]。目前对熊蜂中气味受体的研究很少,仅在B. terrestris全基因组测序后,鉴定获得165个Ors[28]。【本研究切入点】随着测序技术的日渐成熟,许多昆虫的基因组都已被测序,其气味受体也相继被发觉,而且对气味受体越来越深入的研究发现,气味受体对昆虫的社会活动起到十分重要的作用,但目前在熊蜂上气味受体相关的研究很少,对兰州熊蜂气味受体的研究尚未见报道。【拟解决的关键问题】通过对兰州熊蜂基因组测序挖掘气味受体家族,并利用生物信息学的方法对其特性、基因结构、保守结构域和进化关系进行分析,鉴定兰州熊蜂的气味受体家族,为克隆兰州熊蜂气味受体基因提供信息,并为研究气味受体家族在熊蜂中的功能打下基础。1 材料与方法
试验于2016年在中国农业科学院蜜蜂研究所昆虫授粉与生态实验室完成。1.1 试验材料
兰州熊蜂为中国农业科学院蜜蜂研究所昆虫授粉与生态研究室繁育,饲养温度(28±0.5)℃,相对湿度为50%±5%,无光照。取蜂群中雄性蜂,使用基因组DNA提取试剂盒(Wizard Genomic DNA Purification Kit)提取其胸部基因组DNA,交由北京贝瑞和康生物技术有限公司进行Illumina高通量测序,将测序所得原始序列进行质控,拼接获得兰州熊蜂的基因组。使用本地blast 2.2.28+对基因组进行数据库的构建及序列搜索。1.2 序列鉴定与理化特性
使用地熊蜂与意大利蜜蜂的Ors序列作为参考序列进行tblastn搜索,搜索条件设定e值为 1×10-6。选取序列相似度最高部分进行拼接(相似度最低阈值50%)。然后,将拼接获得的编码区序列翻译获得对应氨基酸序列,最后,将氨基酸序列提交到SMART(http://smart.embl-heidelberg .de/)数据库验证其保守结构区域7tm_6(PF02949)。使用TMHMM对序列的跨膜结构域进行预测。使用EMBOSS1.5[29]中PEPSTATS程序对所获得的氨基酸序列进行分子量与等电点预测。
1.3 气味受体基因结构分析
将气味受体家族的每个成员的基因序列与编码区序列提交到在线基因结构分析工具GSDS 2.0[30](http://gsds.cbi.pku.edu.cn/)中,获得基因序列的内含子与外显子位置信息。1.4 基序分析
使用在线工具MEME 4.11.2[31]对Or序列的基序进行分析,设定motif长度在15—30,每个motif包含的位点最少7个,每个序列都进行10个motif的检索,其他参数均为默认参数。1.5 多序列比对及进化分析
使用clustalW 2.1[32]进行多序列比对,利用TrimAl 1.2[33]去除冗余的片段(参数-resoverlap 0.8 -seqoverlap 80-gt 0.7),使用phyML 3.0[34]进行建树,替代模型为JTT,bootstrap为1 000次。2 结果
2.1 兰州熊蜂气味受体序列鉴定
利用地熊蜂与意大利蜜蜂气味受体蛋白序列作为参考序列,通过tblastn搜索兰州熊蜂基因组获得气味受体,共获得165个气味受体蛋白序列,其中包括1个非典型气味受体Orco、4个假基因和159个气味受体。气味受体家族序列长度平均为392 bp,分子量为4.5 kD,等电点为7.97。共有41个序列预测到存在7个跨膜螺旋,81个序列预测到6个跨膜螺旋,且大部分序列都是缺少最后一个跨膜螺旋。从定位信息中发现Or 1—46、Or 58—68、Or 86—95、Or 128—139、Or 150—160分别串联排布在染色体2、13、9、11和4上,Or 47—57与Or 70—84都串联排布在15号染色体上(附表1)。对序列分析发现多个序列在两种熊蜂中出现明显的长度差异(表1)以及氨基酸位点的改变(图1)。Table 1
表1
表11 附
Table 11 Table S1Characteristics of odorant receptors protein sequences of B. lantschouensis
蛋白名称 Protein name | 染色体名称 Chromosome name | 定位 Location | 长度 Length (aa) | 跨膜结构数 TMH number | 外显子个数 Exon number | 分子量 MW (Da) | 等电点 pI |
---|---|---|---|---|---|---|---|
Orco | Un28540 | 928767-936251 | 483 | 7 | 8 | 54690.15 | 8.2048 |
Or1 | 2 | 482126-485327 | 412 | 6 | 5 | 47541.93 | 6.7576 |
Or2 | 2 | 478657-480933 | 403 | 6 | 5 | 47027.48 | 6.8956 |
Or3 | 2 | 475643-477757 | 404 | 6 | 5 | 46795.65 | 9.2078 |
Or 4 | 2 | 471464-473595 | 403 | 6 | 4 | 46517.45 | 8.974 |
Or 5 | 2 | 467482-469339 | 398 | 5 | 5 | 45881.62 | 9.2927 |
Or 6 | 2 | 464642-466323 | 400 | 6 | 5 | 46556.35 | 8.8463 |
Or 7 | 2 | 460745-462594 | 409 | 6 | 4 | 46988.38 | 9.5768 |
Or 8 | 2 | 457941-459706 | 401 | 6 | 5 | 45440.48 | 8.948 |
Or 9 | 2 | 453853-455946 | 408 | 6 | 5 | 46969.37 | 7.6833 |
Or 10 | 2 | 450917-452879 | 411 | 6 | 5 | 47321.87 | 8.3171 |
Or 11 | 2 | 448285-449971 | 403 | 6 | 5 | 46434.94 | 8.3193 |
Or 12 | 2 | 445493-447358 | 418 | 7 | 5 | 47849.77 | 8.1882 |
Or 13 | 2 | 442852-444659 | 406 | 6 | 4 | 46381.63 | 6.8799 |
Or 14 | 2 | 440189-442103 | 405 | 6 | 4 | 46485.07 | 7.8373 |
Or 15 | 2 | 437449-439481 | 409 | 6 | 5 | 46561.39 | 9.0298 |
Or 16 | 2 | 424248-436433 | 405 | 4 | 5 | 46068.13 | 7.641 |
Or 17 | 2 | 431754-433379 | 403 | 5 | 5 | 45616.6 | 7.2887 |
Or 18 | 2 | 428247-429890 | 405 | 7 | 4 | 45864.17 | 8.0239 |
Or 19 | 2 | 424248-427242 | 405 | 4 | 5 | 46293.61 | 8.3518 |
Or 20 | 2 | 420897-422684 | 409 | 7 | 5 | 46533.73 | 6.8209 |
Or 21 | 2 | 416325-418020 | 396 | 6 | 5 | 44910.96 | 6.3019 |
Or 22 | 2 | 413904-415613 | 404 | 7 | 5 | 45777.92 | 6.7602 |
Or 23 | 2 | 410841-412546 | 404 | 8 | 5 | 46123.47 | 7.103 |
Or 24 | 2 | 407557-409275 | 406 | 8 | 5 | 46599.98 | 7.1738 |
Or 25 | 2 | 403263-405732 | 409 | 6 | 4 | 46603.61 | 9.0532 |
Or 26 | 2 | 400727-402362 | 407 | 8 | 5 | 46621.87 | 6.7575 |
Or 27 | 2 | 398051-399481 | 405 | 6 | 5 | 46505.92 | 7.9972 |
Or 28 | 2 | 394636-396952 | 406 | 5 | 5 | 46391.25 | 7.0318 |
Or 29 | 2 | 391957-393726 | 405 | 6 | 5 | 46820.47 | 8.1462 |
Or 30 | 2 | 388467-390272 | 411 | 6 | 5 | 46394.77 | 6.8756 |
Or 31 | 2 | 385647-387314 | 411 | 6 | 5 | 46304.64 | 6.8094 |
Or 32 | 2 | 382826-384703 | 407 | 6 | 5 | 46393.96 | 8.237 |
续附表1 Continued table S1 | |||||||
蛋白名称 Protein name | 染色体名称 Chromosome name | 定位 Location | 长度 Length (aa) | 跨膜结构数 TMH number | 外显子个数 Exon number | 分子量 MW (Da) | 等电点 pI |
Or 33 | 2 | 379626-381672 | 406 | 5 | 5 | 46606.34 | 8.7673 |
Or 34 | 2 | 377049-378912 | 410 | 7 | 5 | 47040.69 | 8.2693 |
Or 35 | 2 | 374595-376129 | 411 | 5 | 5 | 47618.71 | 7.2882 |
Or 36 | 2 | 371716-373537 | 405 | 6 | 5 | 46836.87 | 7.7607 |
Or 37 | 2 | 368445-370173 | 406 | 5 | 5 | 47293.66 | 7.404 |
Or 38 | 2 | 365173-367034 | 406 | 5 | 5 | 47072.09 | 6.6514 |
Or 39 | 2 | 362819-364411 | 407 | 7 | 6 | 46582.2 | 8.6096 |
Or 40 | 2 | 359373-361783 | 411 | 6 | 5 | 47069.73 | 8.4968 |
Or 41 | 2 | 356766-358493 | 405 | 6 | 6 | 46417.86 | 8.6582 |
Or 42 | 2 | 353753-355878 | 410 | 6 | 6 | 47053.52 | 8.0602 |
Or 43 | 2 | 349572-351952 | 410 | 6 | 6 | 46912.7 | 8.7865 |
Or 44 | 2 | 346532-348802 | 410 | 6 | 6 | 47068.01 | 9.2429 |
Or 45 | 2 | 344014-345667 | 414 | 6 | 6 | 47355.92 | 8.5423 |
Or 46 | 2 | 341209-343168 | 410 | 5 | 6 | 46754.46 | 8.2258 |
Or 47 | 15 | 1980901-1983194 | 394 | 5 | 4 | 44985.51 | 5.8349 |
Or 48 | 15 | 1973840-1976111 | 393 | 5 | 4 | 45061.67 | 7.3598 |
Or 49 | 15 | 1968864-1971305 | 394 | 6 | 4 | 44513.7 | 6.9122 |
Or 50 | 15 | 1959206-1961980 | 400 | 5 | 4 | 45815.09 | 8.307 |
Or 51 | 15 | 1955866-1958401 | 394 | 5 | 4 | 44961.08 | 6.5241 |
Or 52 | 15 | 1951879-1954500 | 394 | 6 | 4 | 45095.31 | 5.4846 |
Or 53 | 15 | 1943187-1945126 | 394 | 6 | 4 | 44634.97 | 8.5061 |
Or 54 | 15 | 1948323-1950400 | 394 | 6 | 4 | 44895.11 | 5.7743 |
Or 55 | 15 | 1935545-1937258 | 395 | 6 | 4 | 44851.79 | 6.7822 |
Or 56 | 15 | 1930232-1933957 | 395 | 6 | 4 | 45003.33 | 7.4883 |
Or 57 | 15 | 1926795-1929046 | 394 | 5 | 4 | 44754.79 | 5.7366 |
Or 58 | 13 | 4471630-4474206 | 370 | 6 | 5 | 42736.62 | 8.5376 |
Or 59 | 13 | 4475790-4477695 | 370 | 6 | 5 | 43482.76 | 8.0973 |
Or 60 | 13 | 4479006-4480753 | 372 | 6 | 5 | 43751.48 | 7.2663 |
Or 61 | 13 | 4482511-4484076 | 372 | 6 | 5 | 42944.85 | 8.519 |
Or 62 | 13 | 4485796-4487412 | 371 | 4 | 5 | 43321.94 | 8.7126 |
Or 63 | 13 | 4497685-4499303 | 373 | 6 | 5 | 43113.94 | 8.3297 |
Or 64 | 13 | 4505970-4507531 | 372 | 6 | 5 | 42805.53 | 8.6655 |
Or 65 | 13 | 4509670-4511702 | 374 | 6 | 5 | 44401.1 | 6.9563 |
Or 66 | 13 | 4512729-4514501 | 389 | 4 | 5 | 45148 | 8.635 |
续附表1 Continued table S1 | |||||||
蛋白名称 Protein name | 染色体名称 Chromosome name | 定位 Location | 长度 Length (aa) | 跨膜结构数 TMH number | 外显子个数 Exon number | 分子量 MW (Da) | 等电点 pI |
Or 67 | 13 | 4515730-4518043 | 370 | 5 | 5 | 44180.95 | 7.9921 |
Or 68 | 13 | 4489858-4491423 | 375 | 6 | 5 | 43305.22 | 8.6381 |
Or 69 | 10 | 910913-913324 | 403 | 6 | 6 | 46645.08 | 8.637 |
Or 70 | 15 | 842168-844355 | 403 | 7 | 6 | 46576.47 | 6.589 |
Or 71 | 15 | 845364-848199 | 408 | 7 | 6 | 46812.48 | 8.0805 |
Or 72 | 15 | 849134-851005 | 427 | 6 | 6 | 49553.55 | 8.6555 |
Or 73 | 15 | 852418-854758 | 410 | 7 | 6 | 47442.11 | 8.2785 |
Or 74 PSE | 15 | 858857-861333 | 403 | 7 | 6 | 47002.54 | 8.182 |
Or 75 | 15 | 862192-864340 | 406 | 7 | 6 | 46996 | 7.3313 |
Or 76 | 15 | 865953-868279 | 410 | 7 | 6 | 47581.44 | 8.6188 |
Or 77 | 15 | 869207-871832 | 409 | 5 | 6 | 47814.53 | 7.9742 |
Or 78 | 15 | 875370-877650 | 403 | 7 | 6 | 47006.71 | 8.6009 |
Or 79 | 15 | 878750-882580 | 408 | 7 | 6 | 47728.78 | 8.7887 |
Or 80 | 15 | 883983-885839 | 400 | 8 | 6 | 46465.22 | 8.5710 |
Or 81 | 15 | 888939-890678 | 402 | 8 | 6 | 46919.9 | 7.1621 |
Or 82 | 15 | 892378-894440 | 408 | 6 | 6 | 47563.89 | 8.1453 |
Or 83 | 15 | 895404-897129 | 408 | 6 | 6 | 46946.74 | 8.2507 |
Or 84 | 15 | 899266-900854 | 403 | 7 | 6 | 47102.82 | 8.7745 |
Or 85 | Un495 | 459757-462332 | 408 | 6 | 6 | 47581.2 | 8.404 |
Or 86 | 9 | 13818848-13820627 | 389 | 6 | 6 | 44572.49 | 8.279 |
Or 87 | 9 | 13813284-13815004 | 388 | 6 | 6 | 44959.3 | 8.5504 |
Or 88 | 9 | 13804789-13806505 | 389 | 6 | 6 | 44955.32 | 8.6676 |
Or 89PSE | 9 | 13802115-13803231 | 234 | 3 | 4 | 26418.73 | 7.3067 |
Or 90PSE | 9 | 13798972-13800437 | 389 | 6 | 6 | 45285.33 | 7.5449 |
Or 91 | 9 | 13794855-13796623 | 388 | 6 | 6 | 44560.58 | 8.4939 |
Or 92NTE | 9 | 13789486-13792057 | 397 | 6 | 6 | 46017.09 | 7.3324 |
Or 93 | 9 | 13786276-13788402 | 394 | 6 | 6 | 44723.66 | 6.751 |
Or 94 | 9 | 13779265-13781268 | 394 | 5 | 6 | 44861.79 | 7.6339 |
Or 95 | 9 | 13775964-13777467 | 388 | 6 | 6 | 45189.4 | 9.4428 |
Or 96 | 10 | 1285102-1283191 | 411 | 6 | 6 | 47881.09 | 8.1053 |
Or 97 | 14 | 1095387-1096948 | 401 | 7 | 5 | 45660.07 | 6.5988 |
Or 98 | 14 | 974787-976319 | 400 | 5 | 5 | 46290.14 | 7.0476 |
Or 99 | 14 | 972155-973732 | 402 | 7 | 5 | 46133.25 | 7.7566 |
Or 100 | 14 | 967858-969432 | 402 | 7 | 5 | 46325.34 | 6.9841 |
续附表1 Continued table S1 | |||||||
蛋白名称 Protein name | 染色体名称 Chromosome name | 定位 Location | 长度 Length (aa) | 跨膜结构数 TMH number | 外显子个数 Exon number | 分子量 MW (Da) | 等电点 pI |
Or 101 | Un33828 | 58063-71273 | 379 | 6 | 5 | 43849.91 | 8.2339 |
Or 102 | Un29153 | 107022-116754 | 382 | 5 | 6 | 43781.84 | 7.1109 |
Or 103 | 10 | 954165-956801 | 388 | 7 | 6 | 44040.2 | 8.8254 |
Or 104 | 10 | 949138-951937 | 368 | 6 | 6 | 41844.27 | 6.6373 |
Or 105 | 10 | 942143-944949 | 376 | 5 | 6 | 42707.3 | 6.342 |
Or 106 | 10 | 936574-939188 | 384 | 8 | 6 | 43660.67 | 9.3849 |
Or 107 | 10 | 919184-926556 | 375 | 6 | 6 | 42502.36 | 8.1499 |
Or 108 | 9 | 348644-351671 | 407 | 6 | 7 | 47204.31 | 9.0188 |
Or 109 | 14 | 1807382-1809192 | 394 | 8 | 9 | 45651.46 | 8.3788 |
Or 110 | 15 | 3093156-3098809 | 419 | 7 | 4 | 47052.6 | 7.6661 |
Or 111 | 5 | 1159608-1162411 | 389 | 5 | 7 | 43773.14 | 7.136 |
Or 112 | 1 | 1407814-1405441 | 391 | 7 | 6 | 44759.08 | 8.0304 |
Or 113PSE | 1 | 672409-673490 | 260 | 4 | 4 | 30168 | 9.3507 |
Or 114 | 7 | 2195348-2197151 | 400 | 6 | 5 | 46704.01 | 8.7681 |
Or 115 | 10 | 1024533-1028517 | 398 | 7 | 5 | 46103.85 | 9.4662 |
Or 116 | 2 | 318970-320907 | 353 | 6 | 6 | 40232.6 | 10.1817 |
Or 117 | 9 | 495593-497745 | 373 | 5 | 6 | 42397.95 | 8.1945 |
Or 118 | 9 | 498790-500505 | 370 | 7 | 6 | 42646.02 | 8.1001 |
Or 119 | 9 | 501629-503588 | 371 | 7 | 6 | 42925.13 | 7.6919 |
Or 120 | 9 | 504913-506271 | 380 | 6 | 6 | 43620.71 | 8.078 |
Or 121 | 9 | 510254-511613 | 374 | 8 | 6 | 43159.16 | 8.5767 |
Or 122 | 2 | 1174799-1176400 | 374 | 6 | 6 | 42691.73 | 6.8062 |
Or 123 | 2 | 1185288-1186933 | 374 | 6 | 6 | 42494.3 | 6.3759 |
Or 124 | 6 | 2452805-2454524 | 375 | 6 | 6 | 43252.57 | 8.0053 |
Or 125 | 6 | 2449723-2451395 | 377 | 6 | 6 | 43038.08 | 6.9038 |
Or 126 | 6 | 1666906-1668261 | 374 | 7 | 6 | 43226.2 | 6.8223 |
Or 127 | Un33832 | 8991-18832 | 371 | 7 | 6 | 42313.48 | 7.9947 |
Or 128NTE | 11 | 1441301-1443654 | 397 | 6 | 9 | 46280.12 | 7.1667 |
Or 129NTE | 11 | 1446964-1449030 | 396 | 5 | 9 | 46232.21 | 8.6 |
Or 130NTE | 11 | 1451132-1453678 | 400 | 7 | 9 | 46256.82 | 8.6255 |
Or 131 | 11 | 1457984-1460512 | 401 | 7 | 9 | 46207.64 | 8.3748 |
Or 132 | 11 | 1464787-1466735 | 401 | 5 | 9 | 46411.94 | 9.059 |
Or 133NTE | 11 | 1469208-1471001 | 400 | 7 | 9 | 45820.67 | 8.4550 |
Or 134NTE | 11 | 1473424-1475300 | 400 | 7 | 9 | 46157.9 | 8.7872 |
蛋白名称 Protein name | 染色体名称 Chromosome name | 定位 Location | 长度 Length (aa) | 跨膜结构数 TMH number | 外显子个数 Exon number | 分子量 MW (Da) | 等电点 pI |
Or 135NTE | 11 | 1476852-1478714 | 400 | 7 | 9 | 46113.85 | 8.7146 |
Or 136NTE | 11 | 1480293-1482099 | 400 | 7 | 9 | 45617.17 | 7.831 |
Or 137NTE | 11 | 1483652-1487184 | 398 | 7 | 9 | 45514.29 | 6.8556 |
Or 138NTE | 11 | 1488510-1490603 | 402 | 7 | 9 | 46600.92 | 7.5735 |
Or 139NTE | 11 | 1493028-1495114 | 399 | 5 | 9 | 45921.07 | 7.6238 |
Or 140 | 12 | 3521108-3526782 | 390 | 5 | 9 | 44291.12 | 7.2312 |
Or 141 | 12 | 3515568-3519330 | 387 | 5 | 9 | 43874.4 | 7.884 |
Or 142 | 12 | 3510449-3514084 | 389 | 5 | 9 | 44088.54 | 7.6569 |
Or 143 | 12 | 3502802-3507954 | 388 | 7 | 9 | 44732.68 | 7.3961 |
Or 144 | 12 | 3498366-3501725 | 390 | 6 | 9 | 45145.59 | 8.8435 |
Or 145 | 12 | 3493807-3497011 | 387 | 6 | 9 | 44717 | 9.3391 |
Or 146 | 12 | 3490000-3493021 | 389 | 6 | 9 | 44973.58 | 9.2761 |
Or 147 | 12 | 1175-4823 | 389 | 6 | 9 | 44990.21 | 8.1764 |
Or 148 | Un815 | 47257-58391 | 387 | 6 | 9 | 44756.17 | 8.7327 |
Or 149 | Un815 | 40717-45951 | 388 | 7 | 9 | 44330.98 | 8.3193 |
Or 150CTE | 4 | 6332942-6335940 | 385 | 6 | 9 | 44621.67 | 7.8534 |
Or 151 | 4 | 6328168-6330775 | 385 | 6 | 9 | 44714.87 | 8.5007 |
Or 152 | 4 | 6322040-6324936 | 388 | 7 | 9 | 44891.81 | 8.2734 |
Or 153 | 4 | 6316395-6319226 | 386 | 7 | 9 | 44716.42 | 7.673 |
Or 154 | 4 | 6310556-6313536 | 388 | 6 | 9 | 45183.2 | 7.5479 |
Or 155 | 4 | 6305448-6308358 | 388 | 7 | 9 | 45074.14 | 8.5954 |
Or 156 | 4 | 6300514-6303770 | 396 | 6 | 9 | 45677.44 | 9.0911 |
Or 157 | 4 | 6285695-6288874 | 356 | 6 | 9 | 41832.25 | 8.4428 |
Or 158 | 4 | 6282585-6284952 | 378 | 6 | 9 | 44232.38 | 9.2987 |
Or 159 | 4 | 6278114-6281114 | 388 | 6 | 9 | 45884.55 | 9.1525 |
Or 160 | 4 | 6271160-6274473 | 385 | 8 | 9 | 44698.53 | 9.2686 |
Or 161 | 4 | 5486119-5492869 | 396 | 7 | 9 | 45540.37 | 6.2509 |
Or 162TRA | 4 | 17326-18569, 13367-17195 | 357 | 6 | 9 | 41223.43 | 8.4231 |
Or 163TRA | 1 | 2578-6371, 12568-13834 | 413 | 6 | 9 | 48071.42 | 8.0456 |
Or 164TRA | Un134 | 177717-177618, 176413-174526 | 359 | 6 | 9 | 41582.34 | 8.7529 |
新窗口打开
Table 1
表1
表1兰州熊蜂与地熊蜂中Or序列长度差异
Table 1Difference of Or sequence length between B. lantschouensis and B. terrestris
兰州熊蜂Or序列 Or of B. lantschouensis | 序列长度 Length (aa) | 地熊蜂Or序列 Or of B. terrestris | 序列长度 Length (aa) | |
---|---|---|---|---|
BlOr 66 | 389 | BtOr 66 | 371 | |
BlOr 110 | 419 | BtOr 110 | 438 | |
BlOr 116 | 353 | BtOr 116 | 377 | |
BlOr 128 | 397 | BtOr 128 | 372 | |
BlOr 160 | 385 | BtOr 160 | 401 | |
BlOr 162 | 357 | BtOr 162 | 409 | |
BlOr 164 | 359 | BtOr 164 | 407 |
新窗口打开

图1兰州熊蜂与地熊蜂气味受体序列氨基酸差异位点
-->Fig. 1Different amino acid site of Or sequences of B. lantschouensis and B. terrestris
-->
2.2 基因结构
对所有嗅觉受体基因序列进行结构分析,发现Or 101序列最长,超过13 kb,其第二内含子长度最长(图2-A)。在Or 102、127、148中均包含一个长内含子,导致这些基因序列的长度都超过了10 kb。气味受体家族基因序列外显子个数为4—9个,其中Or 47—57的序列中外显子数量最少,为4个;Or 128—161中外显子的数量最多,为9个。根据基因结构不同,可将所有序列分为10个类型,分别为Or 1—38、39—46、47—57、58—68、69—85、86—96、97—100、101—107、116—127、128—164,每个类型中的序列都有相似的外显子长度与数量。其中,Or 1—38、69—85、128—164这3个类型所包含成员数较多(分别为38、17、37),其他7类包含成员个数都约10个,Or 1—38所有成员都具有较长的第一外显子。2.3 保守基序分析
对所有蛋白序列进行保守基序分析(图2-B),在检索的10个保守基序中(图3),除基序5为未知基序外,其他9个基序均包含在其保守结构域(7tm_6 domain)中。10种基因结构类型序列中Or 1—38与39—46、47—57与86—95、89—85与97—100具有相似的保守基序。在Or 1—46中大部分序列包含全部10个基序,其他序列中均缺失基序10;在Or 47—57 与86—95中,除序列89序列长度缺失外,其他序列中仅缺少基序10;Or 58—68中主要缺少基序6与7;Or 69—85与Or 97—100中主要缺少基序6;Or 115—127中除了缺失基序6之外,还缺少普遍存在基序1与5;Or 128—164的序列中都缺少了基序7。在大部分序列中都包含了基序2、3、4、9,这4个基序可能为该家族关键的功能区域。图2兰州熊蜂气味受体基因结构与保守基序
-->Fig. 2Gene structure and conserved motif of Ors in B. lantschouensis
-->
图3气味受体家族蛋白序列中的保守基序及其序列Logo
-->Fig. 3Sequences Logo of the MEME defined conserved motifs observed among odorant receptors proteins
-->
2.4 气味受体家族进化树
以Orco作为外群,利用地熊蜂、兰州熊蜂、意大利蜜蜂的全部气味受体蛋白序列构建系统发育树(图4)。从系统发育树中可以看出,Or家族明显被分为5个亚家族(I—V)。所有BlOr 58—68成员都聚为亚家族I,BlOr 97—100与BlOr 69—85聚为亚家族II,BlOr 128—164聚为亚家族III,BlOr 86—95、101—107、47—57、1—46聚为亚家族IV,BlOr 110—127聚为亚家族V。在亚家族III中,BlOr 150—155与AmOr 122—139分别聚为两个分支,在亚家族IV的中,BlOr 47—57与AmOr 63—65也发现类似的聚类,这表明在进化中,蜜蜂与熊蜂的Ors出现了特异性的扩张与缺失。在进化树中发现BlOr 115较早与其他成员分离,位于树的基部,而且在结构域分析中Or115中包含的保守基序较少,说明该序列更为接近气味受体家族的祖先序列。
图4意大利蜜蜂、地熊蜂、兰州熊蜂Ors 系统发育树
-->Fig. 4Phylogenetic tree of odorant receptors from A. m. ligustica, B. terrestris and B. lantschouensis
-->
3 讨论
气味受体家族是昆虫化学感受器家族中一类重要的蛋白家族,在昆虫的生存及繁衍生息中都发挥十分重要的作用[12]。目前在许多昆虫中已经发现气味受体家族的存在,例如在果蝇中发现存在62个气味受体[15],家蚕中存在60个[19],金小峰中发现300个[20],蚂蚁中多达400个[21]。在不同的昆虫中,Or家族的成员数量差异很大,这可能是由于在长期进化中,不同物种对嗅觉的依赖程度不同而造成。熊蜂与蜜蜂中假基因的个数比果蝇与蚊类中要多,但是远少于哺乳动物中的假基因(比例高达25%—100%)[35]。在鉴定的所有气味受体中,包括一个非典型气味受体Orco,这个蛋白与果蝇中的DmOr83b同源,序列相似度为61.41%,与蜜蜂中的AmOr2相似度为76.88%,与地熊蜂中的Orco相似度为99.17%[36],这表明该蛋白在不同物种之间高度保守,可以作为判断昆虫进化参数。在兰州熊蜂中,Or家族的成员共有165个基因,其中包括5个假基因,与地熊蜂中气味受体家族成员数目相同,在聚类分析中也出现一一对应的现象,这可能是由于它们具有较近的亲缘关系,导致气味受体序列之间相似度很高,同时这说明这两种熊蜂中对各种化学气味识别机制有可能相近。但是通过对序列的分析发现,两种熊蜂的某些气味受体在序列长度与氨基酸的变异程度上有十分明显的差异(表1、图1),这说明在兰州熊蜂中气味受体序列可能开始出现特异性改变。BlOr家族成员存在串联分布于某条染色体上的现象,这些串联序列具有相似的基因结构,表明Or家族的起源可能是通过祖先序列的多重复制产生。进化分析发现Or家族包含5个亚家族,10种类型的基因结构,在亚家族IV的BlOr 1—46分支中,所有成员的序列中包含一个特有的保守基序10,该基序可能使它们具有特有的功能,而且该分支与蜜蜂中AmOr 1—61聚在一起,AmOr 1—61是已知的昆虫化学感受器中最大的串联重复,其中包含一个已经明确功能的成员AmOr 11,该成员只对蜂王信息素中9-氧代-癸二烯酸(9-ODA)产生特异反应[37]。在另一个成员较多的亚家族IV中,成员序列都含有9个外显子,与蜜蜂中一个同样包含9个外显子的亚家族AmOr 97—113、122—140、159、162聚在一起,该亚家族在蚂蚁中也存在,而且被鉴定为一类参与认巢及同伴识别的表皮烃类受体[31-32,34]。
在序列拼接中发现,BlOr 162—164的第一外显子与其他外显子的编码方向相反,其位置处于其他外显子的下游,这种反式剪切的现象在蜜蜂的气味受体AmOr 140中首次被发现[36],本文的结果也证实了这种现象的存在。
在蜜蜂中这些气味受体与蜜蜂触角叶神经小球的数目相似,而且具有一个近似一对一的关系,这说明一个嗅觉神经元可能仅表达一个气味受体蛋白,而且触角叶神经的轴突突触为单个小球[36],果蝇中也发现类似现象[4,8,38]。在蜜蜂中发现Ors数量远超于果蝇,这可能是由于蜜蜂主要食物为花蜜和花粉,长期进化使得其需要更多Ors识别不同的花香及其复杂社会行为[36]。熊蜂进化程度低于蜜蜂,虽在社会性及采集能力上不及蜜蜂,但是对于一些特定作物如茄科植物的授粉能力却高于蜜蜂,这种现象可能是因为熊蜂与蜜蜂中Ors差异所致。关于熊蜂与蜜蜂之间Ors差异研究较少,故对其进行生物信息学分析有助于揭示其重要功能进化,进一步帮助揭示蜜蜂中复杂的社会行为。
4 结论
通过对兰州基因组的鉴定获得165个气味受体家族成员,包含1个非典型气味受体Orco,5个假基因,159个气味受体。该家族中包含有多个亚家族,家族内成员之间具有相似的基因结构与保守结构域。在进化中由于蜜蜂与熊蜂物种的分化,导致气味受体在进化中发生了物种特异性的扩展与缺失。The authors have declared that no competing interests exist.