0 引言
【研究意义】主要农作物品种审定登记制度实施以来,审定品种的数量呈逐年增多趋势,截至2013年底,玉米审定品种数量就达到了6 291个[1],对品种高效管理带来了挑战;随着玉米品种资源遗传基础日趋狭窄及少数骨干亲本被集中应用,出现了一批在原品种基础上仅做细微改良的派生品种,对品种鉴定技术提出了更高要求;品种审定后进入生产推广环节,出现标签名称与实际包装的种子不符等品种真实性问题,增加了种子市场监管的难度。构建高质量的玉米审定品种标准DNA指纹库对解决上述问题和需求具有重要意义,将为政府的品种管理、企业的品种维权、农民的利益维护提供强有力的技术支撑[2]。【前人研究进展】许多作物都开展了品种DNA指纹库构建,其中开展较早或规模较大的主要有玉米[3-4]、水稻[5]、小麦[6]、油菜[7]、马铃薯[8]、番茄[9]、月季[10]、葡萄[11]等,所用建库技术主要为SSR、SNP、INDEL、AFLP、ISSR等标记也有少量使用。早期由于SSR引物开发难度大,引物筛选评价不够充分,试验程序标准化程度较低,且大部分是基于PAGE凝胶电泳检测平台建立起来的,不同实验室数据可比性较差;近年来随着引物开发数量的增多,对引物筛选和评估的强度提高,建库程序的逐步标准化,以及荧光毛细管电泳检测平台的广泛使用,所建指纹库的质量得到一定提高。【本研究切入点】总结以往作物品种指纹库构建的工作,在以下几个方面尚待进一步完善:一是未能彻底解决不同实验室数据整合和共享的问题,不同实验室数据采集不一致情况未能提出根本的解决方案[12-13];二是所建指纹库多数为选取几十到几百个代表性品种的规模较小的研究型数据库,建库样品为自行收集的材料或种质资源[14-15],并非来自官方登记备案的标准样品;三是所建数据库停留在研究阶段,未经过大量检验实践的充分验证。【拟解决的关键问题】为从根本上解决玉米品种SSR指纹数据整合共享的问题,本研究通过对试验程序、引物特征参数的设置、引物分组的设置、检测平台、分析软件、数据库管理系统进一步规范,确立大规模构建高质量可共享指纹库的切实可行方案;构建规模达到近4 000份的玉米审定品种标准样品SSR指纹库,通过多实验室联合比较试验,保证建库数据的准确性和数据库的可共享性,并通过建立指纹比对平台网站,实现玉米审定品种指纹库在全国种子检验系统的应用。1 材料与方法
1.1 试验材料
建库样品共3 998份,由国家种质库提供,系国家和省级农作物品种审定委员会向品种选育单位收集或在区域试验种子中留取的玉米审定品种标准样品,涉及3 806份玉米审定品种,包括3 361个普通玉米品种(3 540份样品)和445个甜糯玉米品种(460份样品),其中168个品种有2—4个不同来源的同名样品,这些品种基本涵盖了中国曾经推广或正在推广使用的玉米杂交种。1.2 基因组DNA的提取
采取改良的CTAB法提取DNA:每份供试样品均随机抽取50粒种子形成混合样品,充分磨碎后移入2.0 mL离心管;加入700 µL CTAB提取液,65℃水浴60 min;加入等体积的三氯甲烷/异戊醇(24:1)并充分混合,静置10 min后12 000 r/min离心15 min;上清液加入等体积的预冷异丙醇沉淀DNA,12 000 r/min离心10 min,弃上清液;加入70%乙醇清洗2次,晾干后加入100 µL超纯水,充分溶解后备用。除了供试样品外,另外选用一份玉米DH系作为参照样品进行大量DNA提取。同一批次提取的DNA样品,随机抽取约5%进行DNA质量和浓度测定,根据测量值估算稀释成工作液的倍数后对该批DNA统一进行稀释。采用NanoDrop 2000 (Thermo Scientific)紫外分光光度计进行DNA质量和浓度测定。1.3 SSR标记分析
40对建库引物序列信息、采用的PCR反应体系和反应程序以及荧光毛细管电泳检测程序见行业标准《玉米品种鉴定技术规程 SSR标记法》(NY/T 1432-2014)和已发表的论文[16-17]。每对引物其中一条的5′端用一种荧光染料进行标记,共选用了PET、NED、VIC、FAM 4种荧光染料(Applied Biosystems,USA公司合成)。PCR反应在Veriti 384 well Thermal cycler(Applied Biosystem)上进行,荧光毛细管电泳在ABI 3730XL DNA analyzer(Applied Biosystem)上进行,分子量内标采用LIZ 500。采用仪器自带的Date Collection Ver.1.0软件收集原始数据并形成FSA文件。采用北京市农林科学院玉米研究中心与北京华生恒业公司合作开发的SSR指纹分析器(软件登记号:2015SR161217)对FSA文件进行分析,分析时设置的引物特征参数见表1。
Table 1
表1
表1建库引物指纹分析特征参数设置表
Table 1Fingerprint analysis parameter setting of primers for database construction
引物编号 Primer number | 引物名称 Primer name | 染色体位置 | 标记荧光染料Labeling fluorescent dye | 重复单元碱基数 Repeating units | 引物扩增范围 Primers range (bp) | 拖尾峰设置* Tailing peak setting | N+1峰设置 N+1peak setting | 邻峰设置 Adjacent peak setting | PANEL分组 PANEL grouping |
---|---|---|---|---|---|---|---|---|---|
MP01 | bnlg439w1 | 1.03 | NED | 2 | 320—380 | 是,339 Yes, 339 | 是,最高峰 Yes, the highest | 70/50 | MQ1 |
MP02 | umc1335y5 | 1.06 | PET | 2 | 234—256 | 是,240 Yes, 240 | 是,最高峰 Yes, the highest | 50/30 | MQ3 |
MP03 | umc2007y4 | 2.04 | FAM | 2 | 238—296 | 是,262 Yes, 262 | 是,最高峰 Yes, the highest | 70/50 | MQ1 |
MP04 | bnlg1940k7 | 2.08 | PET | 2 | 335—386 | 是,367 Yes, 367 | 是,最高峰 Yes, the highest | 70/50 | MQ2 |
MP05 | umc2105k3 | 3.00 | PET | 2 | 286—352 | 是,305 Yes, 305 | 否 No | 70/50 | MQ1 |
MP06 | phi053k2 | 3.05 | NED | 4 | 333—366 | 否 No | 是,右峰 Yes, the right | 30/20 | MQ2 |
MP07 | phi072k4 | 4.01 | VIC | 4 | 410—433 | 否 No | 是,右峰 Yes, the right | 50/30 | MQ2 |
MP08 | bnlg2291k4 | 4.06 | VIC | 2 | 364—418 | 是,382 Yes, 382 | 是,最高峰 Yes, the highest | 70/50 | MQ1 |
MP09 | umc1705w1 | 5.03 | VIC | 2 | 267—331 | 是,281 Yes, 281 | 是,最高峰 Yes, the highest | 70/50 | MQ1 |
MP10 | bnlg2305k4 | 5.07 | NED | 2 | 244—312 | 是,274 Yes, 274 | 是,最高峰 Yes, the highest | 70/50 | MQ2 |
MP11 | bnlg161k8 | 6.00 | VIC | 2 | 145—219 | 是,183 Yes, 183 | 是,最高峰 Yes, the highest | 70/50 | MQ1 |
MP12 | bnlg1702k1 | 6.05 | VIC | 2 | 265—323 | 是,291 Yes, 291 | 是,最高峰 Yes, the highest | 70/50 | MQ2 |
引物编号 Primer number | 引物名称 Primer name | 染色体位置 | 标记荧光染料Labeling fluorescent dye | 重复单元碱基数 Repeating units | 引物扩增范围 Primers range (bp) | 拖尾峰设置* Tailing peak setting | N+1峰设置 N+1peak setting | 邻峰设置 Adjacent peak setting | PANEL分组 PANEL grouping |
MP13 | umc1545y2 | 7.00 | NED | 4 | 191—246 | 否 No | 是,最高峰 Yes, the highest | 50/30 | MQ1 |
MP14 | umc1125y3 | 7.04 | VIC | 4 | 146—175 | 否 No | 是,最高峰 Yes, the highest | 30/20 | MQ4 |
MP15 | bnlg240k1 | 8.06 | PET | 2 | 221—245 | 否 No | 是,最高峰 Yes, the highest | 50/30 | MQ4 |
MP16 | phi080k15 | 8.08 | PET | 5 | 202—231 | 否 No | 是,左峰 Yes,the left | 30/20 | MQ1 |
MP17 | phi065k9 | 9.03 | NED | 2 | 393—413 | 否 No | 是,最高峰 Yes, the highest | 30/20 | MQ1 |
MP18 | umc1492y13 | 9.04 | PET | 3 | 273—301 | 否 No | 是,最高峰 Yes, the highest | 50/30 | MQ4 |
MP19 | umc1432y6 | 10.02 | PET | 4 | 217—262 | 是,252 Yes, 252 | 是,右峰 Yes, the right | 50/30 | MQ2 |
MP20 | umc1506k12 | 10.05 | FAM | 4 | 167—194 | 否 No | 是,最高峰 Yes, the highest | 50/30 | MQ1 |
MP21 | umc1147y4 | 1.07 | NED | 2 | 154—170 | 否 No | 是,最高峰 Yes, the highest | 50/30 | MQ3 |
MP22 | bnlg1671y17 | 1.10 | FAM | 2 | 174—253 | 是,186 Yes, 186 | 是,右峰 Yes, the right | 70/50 | MQ3 |
MP23 | phi96100y1 | 2.00 | FAM | 4 | 245—277 | 否 No | 是,最高峰 Yes, the highest | 30/20 | MQ2 |
MP24 | umc1536k9 | 2.07 | NED | 2 | 212—241 | 否 No | 是,最高峰 Yes, the highest | 50/30 | MQ3 |
MP25 | bnlg1520k1 | 2.09 | FAM | 2 | 157—210 | 是,179 Yes, 179 | 是,最高峰 Yes, the highest | 70/50 | MQ2 |
MP26 | umc1489y3 | 3.07 | NED | 3 | 232—270 | 否 No | 否 No | 30/20 | MQ4 |
MP27 | bnlg490y4 | 4.04 | NED | 2 | 266—330 | 否 No | 是,最高峰 Yes, the highest | 30/20 | MQ3 |
MP28 | umc1999y3 | 4.09 | FAM | 3 | 176—200 | 否 No | 是,最高峰 Yes, the highest | 30/20 | MQ4 |
MP29 | umc2115k3 | 5.02 | VIC | 5 | 271—300 | 否 No | 是,最高峰 Yes, the highest | 30/20 | MQ4 |
MP30 | umc1429y8 | 5.03 | VIC | 3 | 120—154 | 否 No | 是,最高峰 Yes, the highest | 30/20 | MQ3 |
MP31 | bnlg249k2 | 6.01 | VIC | 2 | 259—313 | 是,265 Yes, 265 | 是,最高峰 Yes, the highest | 70/50 | MQ3 |
MP32 | phi299852y2 | 6.07 | VIC | 3 | 211—255 | 否 No | 是,右峰 Yes, the right | 50/30 | MQ4 |
MP33 | umc2160k3 | 7.01 | VIC | 2 | 199—252 | 否 No | 是,最高峰 Yes, the highest | 50/30 | MQ2 |
MP34 | umc1936k4 | 7.03 | PET | 2 | 154—185 | 是,180 Yes, 180 | 是,最高峰 Yes, the highest | 50/30 | MQ2 |
MP35 | bnlg2235y5 | 8.02 | VIC | 3 | 169—193 | 否 No | 是,最高峰 Yes, the highest | 30/20 | MQ3 |
MP36 | phi233376y1 | 8.09 | PET | 3 | 204—222 | 否 No | 是,右峰 Yes, the right | 30/20 | MQ3 |
MP37 | umc2084w2 | 9.01 | NED | 4 | 177—214 | 否 No | 是,最高峰 Yes, the highest | 30/20 | MQ4 |
MP38 | umc1231k4 | 9.05 | FAM | 2 | 229—292 | 否 No | 是,最高峰 Yes, the highest | 50/30 | MQ4 |
MP39 | phi041y6 | 10.00 | PET | 4 | 295—333 | 否 No | 是,左峰 Yes, the left | 50/30 | MQ3 |
MP40 | umc2163w3 | 10.04 | NED | 2 | 279—360 | 是,322 Yes, 322 | 是,右峰 Yes, the right | 70/50 | MQ4 |
新窗口打开
1.4 建库及数据统计分析
建库过程中采用了植物品种DNA指纹库管理系统(以下简称指纹库管理系统,登记号:2015SR085905),安排至少两组独立平行试验,选取60%以上组数的试验数据一致且试验质量较高的数据和指纹图谱进入标准指纹库,对多组试验中数据不一致而指纹图谱一致的位点,通过人工选择一组试验质量较高的数据和指纹进入标准指纹库,对数据缺失严重的样品,启动新一组独立试验,直到形成位点缺失率控制在5%以下的标准指纹库。采用Power-Marker ver.3.25进行SSR引物位点的等位基因信息统计,采用Microsoft Excel 2010进行引物等位基因频率分布图及差异位点分布图的绘制。
1.5 建库数据的质量评估
为评估所构建SSR指纹库的质量,检验指纹库共享的可能性,开展如下几项评估试验:(1)从建成的标准指纹库中随机抽取200份样品的DNA(约占总数5%,名单略),匿名编号后提供给2个实验室进行检测并与标准指纹库的数据进行对比,采用与构建标准指纹库时相同的建库程序和电泳检测平台,只是仪器型号略有不同,评估不同实验室在同一荧光电泳检测平台上数据采集的一致性和利用指纹库进行成对比较的结果一致性。(2)从标准指纹库中挑选8份代表性样品的DNA(名单略),由北京玉米种子检测中心实验室统一进行PCR扩增,扩增产物提供给具有贝克曼GenomeLabGeXP遗传分析仪的三家实验室进行检测并与标准指纹库的指纹进行对比,评估在不同荧光电泳检测平台上数据采集的一致性和利用指纹库进行成对比较的结果一致性。1.6 指纹比对平台网站的建立
为了实现指纹库在全国种子检验系统中的共享使用,建立玉米品种标准指纹比对服务平台,平台上可以查看玉米审定品种标准指纹库,并提供了全库比较、疑似比较、同名比较、范围内互比等便捷的比对功能。2 结果
2.1 引物等位基因频率分布及多态性评估
对建库引物的总体多态性情况进行了全面的评估,从等位基因个数、基因型个数、PIC值、个体识别率、遗传多样性等多个参数分析,40个建库引物总体多态性较高(表2),这套核心引物是通过代表性玉米自交系和杂交种品种筛选评估后入选的高多态性的引物,表明玉米审定品种大规模建库对引物的评估结果与以往的筛选评估结果基本一致。Table 2
表2
表240个建库SSR引物多态性评估表
Table 2Polymorphism evaluation of 40 SSR primers for database construction
引物编号 Primer No. | 引物名称 Primername | 等位基因数 Allele No. | 基因型数 Genotype No. | PIC | 杂合率 Heterozy-gosity | 个体识别率 DP | 遗传多样性 Gene diversity | 主要等位基因及其频率 Major allele and itsfrequency |
---|---|---|---|---|---|---|---|---|
MP01 | bnlg439w1 | 26 | 160 | 0.83 | 0.81 | 0.95 | 0.85 | 350, 0.31 |
MP02 | umc1335y5 | 9 | 30 | 0.58 | 0.24 | 0.73 | 0.61 | 241, 0.59 |
MP03 | umc2007y4 | 29 | 202 | 0.82 | 0.84 | 0.94 | 0.84 | 256, 0.33 |
MP04 | bnlg1940k7 | 35 | 285 | 0.85 | 0.68 | 0.95 | 0.86 | 348, 0.26 |
MP05 | umc2105k3 | 30 | 220 | 0.84 | 0.72 | 0.96 | 0.85 | 291, 0.32 |
MP06 | phi053k2 | 12 | 45 | 0.69 | 0.66 | 0.88 | 0.73 | 336, 0.41 |
MP07 | phi072k4 | 20 | 118 | 0.69 | 0.54 | 0.84 | 0.71 | 411, 0.50 |
MP08 | bnlg2291k4 | 25 | 145 | 0.75 | 0.79 | 0.92 | 0.78 | 364, 0.36 |
MP09 | umc1705w1 | 32 | 166 | 0.82 | 0.76 | 0.95 | 0.84 | 273, 0.26 |
MP10 | bnlg2305k4 | 27 | 148 | 0.83 | 0.85 | 0.95 | 0.84 | 252, 0.28 |
MP11 | bnlg161k8 | 33 | 253 | 0.90 | 0.92 | 0.98 | 0.90 | 165, 0.18 |
MP12 | bnlg1702k1 | 29 | 199 | 0.84 | 0.75 | 0.96 | 0.85 | 265, 0.30 |
MP13 | umc1545y2 | 22 | 133 | 0.83 | 0.79 | 0.95 | 0.85 | 208, 0.30 |
MP14 | umc1125y3 | 7 | 19 | 0.69 | 0.80 | 0.86 | 0.73 | 173, 0.40 |
MP15 | bnlg240k1 | 10 | 44 | 0.77 | 0.74 | 0.91 | 0.79 | 237, 0.33 |
MP16 | phi080k15 | 11 | 36 | 0.63 | 0.51 | 0.84 | 0.66 | 217, 0.52 |
MP17 | phi065k9 | 4 | 9 | 0.56 | 0.67 | 0.78 | 0.63 | 413, 0.46 |
MP18 | umc1492y13 | 9 | 16 | 0.27 | 0.20 | 0.43 | 0.28 | 278, 0.84 |
MP19 | umc1432y6 | 24 | 83 | 0.48 | 0.49 | 0.72 | 0.50 | 222, 0.69 |
MP20 | umc1506k12 | 13 | 50 | 0.73 | 0.74 | 0.91 | 0.76 | 185, 0.39 |
MP21 | umc1147y4 | 4 | 10 | 0.30 | 0.31 | 0.52 | 0.32 | 154, 0.81 |
MP22 | bnlg1671y17 | 36 | 220 | 0.89 | 0.69 | 0.97 | 0.90 | 184, 0.19 |
MP23 | phi96100y1 | 9 | 40 | 0.73 | 0.62 | 0.90 | 0.77 | 253, 0.36 |
MP24 | umc1536k9 | 12 | 50 | 0.71 | 0.71 | 0.89 | 0.75 | 222, 0.39 |
MP25 | bnlg1520k1 | 28 | 129 | 0.69 | 0.80 | 0.86 | 0.73 | 173, 0.36 |
MP26 | umc1489y3 | 8 | 25 | 0.67 | 0.73 | 0.86 | 0.72 | 233, 0.35 |
MP27 | bnlg490y4 | 16 | 59 | 0.72 | 0.40 | 0.88 | 0.76 | 271, 0.37 |
MP28 | umc1999y3 | 7 | 20 | 0.52 | 0.62 | 0.75 | 0.59 | 176, 0.55 |
MP29 | umc2115k3 | 17 | 86 | 0.83 | 0.57 | 0.95 | 0.85 | 276, 0.21 |
MP30 | umc1429y8 | 9 | 17 | 0.52 | 0.62 | 0.76 | 0.59 | 126, 0.55 |
MP31 | bnlg249k2 | 31 | 174 | 0.81 | 0.81 | 0.95 | 0.83 | 263, 0.35 |
MP32 | phi299852y2 | 14 | 46 | 0.74 | 0.52 | 0.91 | 0.78 | 234, 0.29 |
MP33 | umc2160k3 | 21 | 84 | 0.76 | 0.83 | 0.92 | 0.79 | 207, 0.30 |
MP34 | umc1936k4 | 9 | 32 | 0.56 | 0.58 | 0.79 | 0.61 | 170, 0.56 |
MP35 | bnlg2235y5 | 10 | 40 | 0.71 | 0.76 | 0.90 | 0.74 | 183, 0.43 |
MP36 | phi233376y1 | 8 | 29 | 0.69 | 0.64 | 0.89 | 0.73 | 215, 0.35 |
MP37 | umc2084w2 | 13 | 55 | 0.78 | 0.71 | 0.93 | 0.81 | 185, 0.29 |
MP38 | umc1231k4 | 8 | 16 | 0.40 | 0.35 | 0.68 | 0.51 | 261, 0.54 |
MP39 | phi041y6 | 22 | 101 | 0.74 | 0.76 | 0.91 | 0.77 | 309, 0.36 |
MP40 | umc2163w3 | 36 | 162 | 0.81 | 0.52 | 0.93 | 0.83 | 310, 0.27 |
平均 Mean | — | 18 | 94 | 0.70 | 0.65 | 0.86 | 0.73 | — |
新窗口打开
通过统计审定品种在40个引物位点上的等位基因频率分布情况,绘制了40个玉米建库引物的等位基因频率分布图(图1),由于不同引物在等位基因数、等位基因频率上具有不同的分布特征,引物的等位基因频率分布图可以作为每个引物的特征图谱。
![](https://www.chinaagrisci.com/article/2017/0578-1752/0578-1752-50-1-1/thumbnail/img_1.png)
图1部分建库引物等位基因频率分布图(MP01—MP10)
-->Fig. 1The allele frequency distribution of a part of primers for maize fingerprint database construction (MP01-MP10)
-->
一般情况下,荧光毛细管电泳叠加峰图与相应引物的等位基因频率分布图的图型特征应基本相似,因此,在具体建库试验中,引物等位基因频率分布图可以发挥与参照样品相似的作用。以引物MP35为例(图2),该引物的等位基因频率分布图(A)的基本特征可以概括为175、183频率高,175、180、188、189、193频率中等,178、181、186、192频率低,除此之外的其他等位基因应没有或极其稀有;未校正前的原始荧光毛细管电泳叠加峰图(B1)则178、186频率高,而175、183频率中或低,并出现了2个新等位基因。这显然与引物MP35的特征不符;对峰图进行整体向右移动3 bp的校正后的荧光毛细管电泳叠加峰图(B2)则完全符合引物MP35的等位基因频率分布图特征,表明即使没有参照样品,通过对照引物的等位基因频率分布图也可以实现数据的准确读取。
![](https://www.chinaagrisci.com/article/2017/0578-1752/0578-1752-50-1-1/thumbnail/img_2.png)
图2利用引物等位基因频率分布图校正荧光毛细管电泳叠加峰图的位置(引物:MP35)A:引物等位基因频率分布图;B1:未校正位置的荧光毛细管电泳叠加峰图;B2:校正位置后的荧光毛细管电泳叠加峰图(整体向右移动3 bp)
-->Fig. 2Superimposed peak diagram of fluorescence capillary electrophoresis corrected by the allele frequency distribution of primer (MP35)A: The allele frequency distribution of primers; B1: Uncorrected superimposed peak diagram of with fluorescence capillary electrophoresis; B2: Corrected superimposed peak diagram of with fluorescence capillary electrophoresis (overall moved to the right 3 bp)
-->
2.2 十重荧光毛细管电泳组合及PANEL的建立
基于40个玉米建库引物的引物扩增范围、等位基因分布等特征,形成了一套十重荧光毛细管电泳组合,并进一步在SSR analyzer中设置了相应的系统默认PANEL(表3),该套PANEL分4组,每组中均包括10个引物,相同颜色的荧光组合了2—3个引物。这套PANEL相当于不同实验室建库时的标准语言,有助于不同实验室建库数据的共享,并大大提高了建库的效率。Table 3
表3
表3建库SSR引物Panel组合信息表
Table 3The panel information of 40 primers for maize fingerprint database construction
Panel编号 No. of panel | 荧光类型 Fluorescent dye type | 引物编号(等位变异范围,bp)No. of primer (range of allel, bp) | ||
---|---|---|---|---|
1 | 2 | 3 | ||
MQ1 | FAM | P20(166—196) | P03(238—298) | |
VIC | P11(144—220) | P09(266—335) | P08(364—420) | |
NED | P13(190—248) | P01(319—382) | P17(391—415) | |
PET | P16(200—233) | P05(287—354) | ||
MQ2 | FAM | P25(157—211) | P23(244—278) | |
VIC | P33(198—254) | P12(263—327) | P07(409—434) | |
NED | P10(243—314) | P06(332—367) | ||
PET | P34(153—186) | P19(216—264) | P04(334—388) | |
MQ3 | FAM | P22(173—255) | ||
VIC | P30(119—155) | P35(168—194) | P31(260—314) | |
NED | P21(152—172) | P24(212—242) | P27(265—332) | |
PET | P36(202—223) | P02(232—257) | P39(294—333) | |
MQ4 | FAM | P28(175—201) | P38(227—293) | |
VIC | P14(144—174) | P32(209—256) | P29(270—302) | |
NED | P37(176—216) | P26(230—271) | P40(278—361) | |
PET | P15(220—246) | P18(272—302) |
新窗口打开
2.3 指纹库构建情况分析
统计审定品种指纹库构建的试验情况,61%的样品做了2组独立试验,33%的样品做了3组独立试验,6%的样品做了4或5组独立试验,每份样品一般具有2—5套原始试验数据及对应的指纹图谱。样品指纹负责人对多组试验数据进行审核后,缺失的位点占0.15%;不同组试验存在数据差异的位点占6.08%。分析数据差异的原因,表明大部分是由于样品在个别位点上一致性较差形成高低峰或多峰,介于阈值附近的峰在不同组试验中峰高存在细微差异,造成不同组自动采集的数据不同,对这些差异位点进一步人工比较指纹图谱,6.03%的位点指纹图谱一致并经人工审核后入标准指纹库。最终建成的审定品种标准指纹库累计缺失和差异位点仅占0.2%,数据完整性达到99.8%,标准指纹库的数据和图谱均来自至少2组指纹图谱一致的独立试验数据,数据准确性高。不同实验室在相同电泳检测平台上的试验结果显示,37个建库引物表现出高度的试验稳定性和重复性,不同实验室采集数据的差异低于5%,采集的指纹图谱一致,指定样品的成对比较结果也是一致的;3个建库引物(M02、MP18、MP38)在不同实验室采集数据的差异略高于5%,今后可以考虑筛选出更好的建库引物进行替换。不同实验室在不同电泳平台上试验的结果显示:同一样品DNA在3台GenomeLabGeXP遗传分析仪上获得的原始数据的差异在0.5 bp以内;而同一样品DNA在GenomeLabGeXP遗传分析仪与ABI 3730XL遗传分析仪上获得的原始数据存在1—5 bp的差异。评估结果表明,同一荧光电泳检测平台上获得SSR指纹数据一致性高,而不同的电泳检测平台获得的数据存在一定偏差,因此,要想实现不同实验室的数据共享,获得高度一致的SSR指纹图谱和高度一致的样品成对比较结果,需要统一荧光引物、统一分析软件及统一电泳检测平台。
2.4 审定品种指纹库整体情况
对审定品种指纹数据进行两两比较,共涉及7 332 535对比较,结果表明,中国玉米审定品种之间差异比较大,品种间差异位点百分比集中在80%—95%(占78.28%),品种间差异位点百分比在50%以上的已达到99.21%,而低于20%的只有0.09%(表4)。由于这些审定品种代表了中国生产上推广的几乎全部品种,这一信息对今后的实际品种鉴定具有一定参考价值:由于中国玉米审定品种之间差异较大,因此,实际品种鉴定中当2个样品之间差异位点百分比低于50%时,就需要考察2个样品是否存在亲缘关系或具有共同亲本。Table 4
表4
表4玉米审定品种指纹数据两两比较情况
Table 4Pairwise comparison of maize varieties with fingerprint data
差异位点百分比 Percentage of different loci (%) | 涉及成对比较的对数 The number of pairwise comparisons | 成对比较的百分比 Percentage of pairwise comparisons (%) | 成对比较的累计百分比 Cumulative percentage of pairwise comparisons (%) |
---|---|---|---|
95—100 | 471610 | 6.43 | 6.43 |
90—95 | 1805540 | 24.62 | 31.06 |
80—90 | 3934675 | 53.66 | 84.72 |
70—80 | 888814 | 12.12 | 96.84 |
60—70 | 133033 | 1.81 | 98.65 |
50—60 | 40762 | 0.56 | 99.21 |
40—50 | 24549 | 0.33 | 99.54 |
30—40 | 16776 | 0.23 | 99.77 |
20—30 | 10187 | 0.14 | 99.91 |
10—20 | 4930 | 0.07 | 99.98 |
5—10 | 1209 | 0.02 | 99.99 |
0—5 | 450 | 0.01 | 100.00 |
新窗口打开
对玉米审定品种杂合率水平进行分析(表略),平均品种杂合率达到64%,主要集中在50%—80%(占89%),表明对大部分玉米审定品种而言,40核心引物中均能筛选到20—30个双亲互补型引物,这对利用指纹库筛选玉米审定品种的纯度鉴定引物具有重要价值。
322份样品(约占8%)存在2—3个样品指纹相同的情况,对这322份样品已经提交审定标准样品管理机构,正在进一步核实是否来自于同一品种,如果来自同一品种,应在标准样品库中将指纹相同的样品保留一份,其他进行合并或清理,如果来自不同品种,应进一步提供其他差异。标准样品库的清理工作完成后,就能够保证一个品种名称只有一个唯一的指纹图谱且相同的指纹图谱只对应一个品种名称,从而大大提高审定品种标准指纹库在真实性检测实践中的应用价值。
2.5 指纹库的应用效果
玉米品种标准指纹比对服务平台(网址:http://www.maizedna.org/)自2015年正式上线(网站界面见图4),平台上提供了已建成的全部玉米审定品种SSR指纹。该平台已向农业部授权的省级种子检测机构开放,甘肃、北京、河南等多个省级种子检测机构已经开始使用,在市场监督抽查、区试、品种权执法、企业维权等真实性检测方面已发挥了重要作用:在没有指纹比对平台之前,开展玉米真实性检测时,需要将待测样品和审定品种的标准样品一起进行成对比较试验,这意味着检测机构每次都要向种质库申请相应的标准样品进行试验,不仅会造成标准样品频繁出库,而且使室内检验的工作量翻倍;有了指纹比对平台后,则只需对待测样品进行试验,然后将待测样品指纹与平台的标准指纹进行比对就可以直接出具检测结果。![](https://www.chinaagrisci.com/article/2017/0578-1752/0578-1752-50-1-1/thumbnail/img_3.png)
图4指纹比对服务平台网站界面
-->Fig. 4A service platform website for corn variety standard fingerprint matching
-->
3 讨论
3.1 指纹库数据的采集
指纹库构建时采用什么样的数据记录方式不仅影响数据库构建的难易程度,还影响数据库使用的方便程度。汇总以往指纹库构建时采用的数据记录方式,主要分为以下2种:第一种是0/1编号,即按照电泳谱带的有无记录,有带记录为1,无带记录为0,这种方式在早期构建的指纹库中被使用过[12],现在的建库中已经较少使用。
第二种是等位基因代码,根据等位基因代码的编号方式进一步分为3类:第1类是按等位基因扩增产物大小的顺序用阿拉伯数字依次编号[18],部分研究者进一步按基因型进行了编码[19],这在小规模建库时具有简单直观的优点[20],但当建库规模扩大时面临新增等位基因无法编号的问题以及多实验室数据不易整合的问题;第2类是主要依据重复序列的重复次数对等位基因命名,这种方式具有命名严谨规范的优点,当采用多种检测平台建库时数据兼容性更强,在人类指纹库构建中采用了这种命名方式[21],选择的建库引物主要是4—5碱基重复类型的,个别作物如葡萄等通过重新开发和筛选合适的引物也开始使用这种方式[11],但这种命名方式对标记的选择比较严苛,2碱基重复类型的引物由于拖尾峰等峰型的干扰和扩增区间出现插入缺失的干扰不易准确确定碱基重复次数,不适合采用这种命名方式。由于大部分作物在筛选建库引物时主要考虑了引物多态性和试验重复稳定性,而2碱基重复类型的SSR引物的开发数量和多态性普遍高于3碱基以上的引物,造成建库引物中2碱基重复类型的SSR引物比例较高,因此,大部分作物目前不适合采用重复次数的命名方式;第3类是依据等位基因扩增产物大小对等位基因命名,这种方式不仅有利于不同实验室数据的整合,而且对标记的要求有所降低,在大规模建库中对扩增区间出现的插入缺失具有较高的容忍度,是适合目前大多数作物品种SSR指纹库构建的方式,本研究对玉米审定品种建库即采用了这种数据采集方式。
3.2 指纹库的级别
根据指纹库的实际使用价值不同,可将指纹库分为3个级别:初级指纹库仅起辅助筛查的作用;中级指纹库能够利用指纹库直接出具部分检测结果,仍有部分样品需进一步增加试验才能出具结果;高级指纹库能够利用指纹库直接出具几乎全部检测结果。除了人类和少数动植物物种外,目前基于SSR标记建立的大部分作物指纹库仍只能起到辅助筛查的作用,而能否调取原始指纹图谱,是影响作物SSR指纹库利用价值的关键因素:与人类以个体为基础的指纹库不同,作物品种指纹库构建时存在品种内部不同个体的一致性问题,如果只采集数据,则只能反映该品种的主要等位基因信息,如果同时采集指纹图谱则不仅能反映所有等位基因及其大致比例,也能反映试验质量和数据的可靠程度,因此只有整合了数据和指纹图谱的作物品种SSR指纹库才有可能发挥直接出具检测结果的价值。本研究构建的玉米审定品种SSR指纹库通过同时采集数据和指纹图谱入库,实现了能够直接出具检测结果的目标,对其他作物品种SSR指纹库构建重要借鉴价值。
以往的研究者还在水稻[22]、高粱[15]、油菜[14]、百合[19]、大豆[23]等许多作物上开展了分子身份证的研制,通过将指纹数据转换为条形码或二维码的形式制作分子身份证,部分分子身份证还加入了商品信息等其它辅助信息[22],但尚未见综合利用分子数据和指纹图谱信息的报道。下一代的分子身份证可采取与指纹库网站建立链接的方式,建立每个品种的在网站上的二维码,通过扫描二维码,即可调取该品种的分子数据信息及指纹图谱信息。
3.3 可共享SSR指纹库的构建
SSR标记具有多等位基因的特点,这一特点对指纹库构建带来正反两方面的影响。从正面影响看,一是标记多态性高,区分品种能力强,一个SSR标记大约相当于10个SNP标记的区分能力[24],用较少标记就能对大量品种进行有效区分;二是基因型类型较多,可以采用混合样品建库,当进行样品成对比较时,只要在比较的位点上不存在共同等位基因,即使样品一致性差,也可以明确判定为差异位点,而SNP标记基因型最多只有3个,在样品一致性差的情况下无法采用混合样品建库及成对比较;三是杂交种的杂合率比较高,可以很容易筛选到双亲互补型的引物用于杂交种纯度鉴定。从负面影响看,一是SSR标记等位基因数一般在2个以上,不属于二态的标记类型,基因分型主要采用基于长度多态的电泳检测平台,检测通量一般在10个位点以内,很难实现位点高通量的检测;二是等位基因分布比较密集带来不同实验室、不同检测平台数据整合的难度。对于SSR检测通量低问题,今后通过扩增产物测序的方式有可能实现一次检测几千个SSR位点。实现几百到几千个位点的复合检测[25]。对于指纹库数据整合的问题,目前采取在建库方案、取样方案、检测平台、指纹分析工具和引物设置等方面进行统一规范的方式实现SSR数据整合[26],今后可通过开发重复次数严格按照重复单元的倍数增减的3—5碱基重复类型的玉米SSR引物,并在指纹数据采集时依据重复序列的重复次数对等位基因命名,从而大大降低共享数据库构建的难度。在建库程序标准化的基础上,为进一步消除不同实验室或同一实验室不同时期试验的系统误差,还需要通过参照样品进行数据的校正。荧光毛细管电泳检测平台上只需提供1份参照样品就可发挥校正系统误差的作用,在玉米指纹库构建过程中,为试验设计方便,将每块电泳板的最后一个孔位作为放置参照样品扩增产物的位置,SSR指纹分析器在指纹分析过程中,依据该位置的已知标准指纹对PANEL进行左右整体位移,直到参照样品的读取指纹与其已知标准指纹一致。参照样品在作物品种共享指纹库构建中的价值已经得到了认可,然而选用什么样的参照样品,以及如何使用参照样品还有待商榷:部分研究者推荐的参照样品是从国家库中选取的一套代表建库引物的主要等位基因的标准样品[27]。从今后的检测实践看,参照样品应同时具有样品高度一致和容易大量提供的特点,由指定实验室统一繁殖并统一提供比从国家库取用更加方便,一致性高的自交系(或DH系)比杂交种更适合作参照样品。
4 结论
通过对试验程序、引物特征参数的设置、引物分组的设置、检测平台、分析软件、数据库管理系统进一步规范,形成了构建作物品种SSR指纹库的标准化程序。构建了近4 000份高质量玉米审定品种的SSR指纹库,建立了玉米品种标准指纹比对服务平台网站,实现了玉米审定品种指纹库在全国种子检验系统中的共享。The authors have declared that no competing interests exist.