删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

甘蓝SNP标记开发及主要品种的DNA指纹图谱构建

本站小编 Free考研考试/2021-12-26

李志远, 于海龙, 方智远, 杨丽梅, 刘玉梅, 庄木, 吕红豪, 张扬勇. 甘蓝SNP标记开发及主要品种的DNA指纹图谱构建[J]. 中国农业科学, 2018, 51(14): 2771-2787 https://doi.org/10.3864/j.issn.0578-1752.2018.14.014
LI ZhiYuan, YU HaiLong, FANG ZhiYuan, YANG LiMei, LIU YuMei, ZHUANG Mu, HongHao, ZHANG YangYong. Development of SNP Markers in Cabbage and Construction of DNA Fingerprinting of Main Varieties[J]. Scientia Acricultura Sinica, 2018, 51(14): 2771-2787 https://doi.org/10.3864/j.issn.0578-1752.2018.14.014

0 引言

【研究意义】结球甘蓝(Brassica oleracea L. var. capitata)简称甘蓝,在中国各地广泛栽培。截止至2015年,中国审(鉴、认)定或登记的甘蓝品种共计247个[1,2,3,4,5],其中大部分为一代杂种。近年来,市场上的甘蓝品种不断增多,种植面积不断增大。但是,在种子市场上同名异物及同物异名的情况时有发生,甚至一些不合格种子混入市场,造成巨大的经济损失。因此,对品种进行快速准确鉴定,对于假种辨别和产权纠纷具有重要作用。【前人研究进展】早期的品种鉴定手段主要依赖于形态学鉴定,这种方法耗时较长且易受环境影响。随着分子生物学的发展,分子标记技术的出现为品种鉴定提供了新的手段。分子标记技术具有周期短、不受环境条件影响、可进行高通量测试分析等优点,已经在品种鉴定、种子纯度鉴定等方面得到广泛应用[6,7]。随着生物技术的进步,陆续有基于RFLP、AFLP、SSR、SNP等分子标记用于DNA指纹图谱的构建。其中,SNP分子标记是国际植物新品种权保护联盟(UPOV)BMT分子测试指南中构建DNA指纹数据库的推荐标记之一[8]。相对于传统标记,利用SNP标记构建的指纹图谱具有数量多、分布广泛、稳定性高、易于快速且高通量分型的特点[9,10]。分子标记技术在甘蓝品种指纹图谱构建中得到了广泛的应用,薄天岳等[11]通过SRAP、RAPD 2种分子标记方法,构建了甘蓝品种‘争春’、 ‘寒光2号’及其各自亲本的DNA指纹图谱,并将其用于种子纯度鉴定。宋顺华等[12]利用AFLP标记对来自全国的44份甘蓝品种进行分析,并构建了其指纹图谱。陈琛等[13]利用5对SSR标记构建了6个秋甘蓝品种及其亲本共18份材料的指纹图谱。王庆彪等[5]利用20对SSR标记构建50份中国甘蓝代表品种DNA指纹数据库并阐述了甘蓝SSR-DNA指纹鉴定的应用和技术流程。【本研究切入点】目前,甘蓝品种鉴定中常用的指纹图谱是基于AFLP、SSR等分子标记。但是,传统AFLP、SSR指纹图谱存在标记数量有限、检测位点少,位点的突变率高、对变异反应比较敏感等缺点。SNP标记作为第三代分子标记,具有数量多、分布广泛、二态性、易于快速且高通量的进行基因分型等优点。SNP标记已经在玉米[14]、油菜[15]、香菇[16]等作物指纹图谱构建中得到应用,但在甘蓝类蔬菜中尚未有基于SNP标记的指纹图谱。【拟解决的关键问题】本研究基于甘蓝高代自交系的重测序数据开发SNP标记,利用KASP技术对主要甘蓝品种进行基因分型[17],根据分型结果筛选筛选在染色体上均匀分布、多态性信息较高的SNP位点作为核心标记,并利用核心SNP标记构建甘蓝品种指纹图谱,为甘蓝品种真实性、特异性鉴定提供重要依据。

1 材料与方法

1.1 供试材料

试验于2016年12月至2017年5月在中国农业科学院蔬菜花卉研究所甘蓝遗传育种实验室进行。
指纹图谱构建:从国内主要育种单位搜集(鉴定、登记)市场上推广的主要代表品种59个(电子附表1)。
Table 1
附表1
附表1供试的主要甘蓝品种
Table 1The cabbage main varieties used in this study
编号
Code
品种名称
Varieties name
编号
Code
品种名称
Varieties name
编号
Code
品种名称
Varieties name
1中甘8号
Zhonggan 8
21绿球66
Lvqiu 66
41中甘301
Zhonggan 301
2京丰1号
Jingfeng 1
228398
8398
42中甘101
Zhonggan 101
3惠丰3号
Huifeng 3
23苏甘21
Sugan 21
43争春
Zhengchun
4惠丰4号
Huifeng 4
24春丰
Chunfeng
44中甘96
Zhonggan 96
5惠丰5号
Huifeng 5
25怡春
Yichun
45中甘192
Zhonggan192
6惠丰6号
Huifeng 6
26中甘19
Zhonggan 19
46中甘1305
Zhonggan 1305
7豫甘1号
Yugan 1
27博春
Bochun
47中甘1229
Zhonggan 1229
8豫甘3号
Yugan3
28中甘17
Zhonggan 17
48中甘1327
Zhonggan 1327
9豫甘4号
Yugan 4
29豫生早熟牛心
Yushengzaoshuniuxin
49中甘20号
Zhonggan 20
10西园4号
Xiyuan 4
30争牛
Zhengniu
50中甘1280
Zhonggan 1280
11中甘9号
Zhonggan 9
31苏晨1号
Suchen 1
51中甘593
Zhonggan 593
12中甘56
Zhonggan 56
32豫甘5号
Yugan 5
52中甘594
Zhonggan 594
13春甘2号
Chungan 2
33嘉兰
Jialan
53中甘596
Zhonggan 596
14中甘588
Zhonggan 588
34铁头102
Tietou 102
54晚丰
Wanfeng
15中甘828
Zhonggan 828
35瑞甘16
Ruigan 16
55庆丰
Qingfeng
16中甘628
Zhonggan 628
36瑞甘17
Ruigan 17
56中甘1268
Zhonggan 1268
17秦甘60
Qingan 60
37苏甘55
Sugan 55
57中甘1266
Zhonggan 1266
18秦甘78
Qingan 78
38中甘18
Zhonggan 18
58中甘21
Zhonggan 21
19中甘11号
Zhonggan 11
39西星甘蓝1号
Xixingganlan 1
59秋甘1号
Qiugan 1
20瑞甘60
Ruigan 60
40中甘15
Zhonggan 15


新窗口打开
核心SNP标记验证:在上述59个主要甘蓝品种中挑选15个已推广的品种,及5个未推广的新组合。每个品种或组合取3粒种子,将种子混合构成人工虚拟混合群体。

1.2 DNA提取

将59个主要代表品种的种子放于培养皿中,采用纸上发芽,放置于25℃恒温培养箱中,催芽5—6 d。取子叶和下胚轴,每份样品中取若干个体,共计0.5 g,采用改良CTAB法[18]提取DNA,使用冷冻干燥机将样品DNA抽干后置于-80℃保存。
将人工虚拟混合群体种子混合催芽,然后按单个幼苗提取DNA。

1.3 KASP标记开发及检测

对50个甘蓝高代自交系进行重测序,所测的自交系涵盖了不同茬口(春、秋、越冬)、不同熟性(早、中、晚)及不同球型(扁、圆、尖)的材料,具有很好的代表性。利用重测序数据与参考基因组(02-12)[19]进行比对,开发SNP位点。对获得的SNP位点按以下条件进行筛选:(1)位点的未测通材料数<20;(2)多态性在40%—60%;(3)在染色体中均匀分布;(4)位点前后各50 bp不存在其他变异。对于筛选获得的SNP位点,截取其前后各50 bp序列,交由LGC公司开发设计KASP引物。
PCR反应体系(10.14 µL)为KASP Master mix 5 μL、KASP Primer mix 0.14 μL和模板DNA(20 ng·μL-1)5 μL。PCR反应条件为第一轮94℃ 15 min;94℃ 20 s,61—55℃ 60 s,10个Touch Down循环(每个循环降低0.6℃);第二轮94℃ 20 s,55℃ 60 s,26个循环。使用荧光微孔板检测仪检测PCR产物,用LGC公司开发的SNPviewer软件读取检测数据。所用KASP Master mix 购自英国LGC公司,货号为KBS-1016-012。

1.4 数据处理

根据分型结果计算出各个标记的等位基因频率,然后利用软件PIC_Calc 0.6计算各标记的多态性信息含量(polymorphism information content,PIC),计算公式为PIC = 1-∑fi2,其中fi为i位点基因频率。依据SNP标记具有的二态性特点,将分型数据转化为二元编码数据,将野生型(与参考基因组一致)表示为(1,0),突变体表示为(0,1),将杂合基因型表示为(1,1),缺失碱基位点记为(999,999),对每份材料进行基因型统计,利用NTSYSpc2.1软件进行相似系数计算及基于UPGMA算法的聚类分析[15]

1.5 核心SNP位点的挑选及其在品种鉴定中的应用

根据基因分型结果,筛选出多态性信息含量>0.35、无基因型数据缺失、在9条染色体上均匀分布的SNP位点作为构建甘蓝品种指纹图谱的核心位点。
利用核心SNP标记位点,对人工构建的虚拟混合群体进行SNP标记分析,并与已有SNP-DNA指纹图谱进行比对,判定虚拟混合群体的60个样品的分型结果是否与指纹图谱数据库中相应品种对应。

2 结果

2.1 甘蓝SNP标记的开发

对50个甘蓝高代自交系进行重测序,平均测序深度为5×。将重测序数据与参考基因组02-12进行比对,共获得SNP位点2.54×106个。筛选位点多态性介于40%—60%、未测通材料数<20的SNP位点,共获得2.59×104个。进一步筛选在9条染色体上均匀分布、位点前后各50 bp不存在其他变异位点的SNP位点,最终获得500个SNP位点用于下一步试验,平均每条染色体上55.6个。500个SNP位点中有442个成功转化为KASP标记,转化成功率为88.4%。
利用KASP平台对59个甘蓝品种进行基因型检测,442个KASP标记全部成功分型。在442个标记中,有25个标记的未分型材料数>5,为保证结果准确性,在后续分析中将这25个标记去除。在59个甘蓝品种中,全部标记的杂合位点比例大于30%的品种有57个,占所有品种的96.6%(图1)。其中,品种‘豫生早熟牛心’的杂合位点比例最高,为67.8%;‘秦甘78’杂合位点比例最低,为18.8%。所有SNP标记在全部品种中多态性信息含量(PIC)处于0.12—0.38,PIC值大于0.35的位点占所有位点的63.5%,其中PIC值为0.37的位点最多,有157个(图2)。
显示原图|下载原图ZIP|生成PPT
图1417个SNP标记的多态性信息含量分布情况
-->Fig. 1Distribution of polymorphism information content in 417 SNP markers
-->

显示原图|下载原图ZIP|生成PPT
图2基于417个SNP标记的59个主要甘蓝品种的杂合基因型比例
-->Fig. 2Heterozygous genotype ratio of 59 main varieties based on 417 SNPs
-->

2.2 核心SNP位点的挑选及DNA指纹图谱的构建

综合考虑基因分型结果,筛选PIC值大于0.35、无基因型数据缺失、在9条染色体上均匀分布的SNP位点作为构建甘蓝品种指纹图谱的核心位点,最终获得50个SNP位点用以构建主要品种的指纹图谱(表1)。50个核心SNP位点中,位点Bol2-56的PIC值最高,为0.38;位点Bol8-11的PIC值最低,为0.35;平均PIC值为0.36,表现为中度多态性。
Table 1
表1
表1用于构建指纹图谱的50对核心引物
Table 1The information of 50 core primers for fingerprinting
名称
Name
染色体
Chromosome
位置
Position(bp)
引物序列
Sequence of primer (5′-3′)
变异类型
Alleles type
PIC
Bol1-1114798641F: CCTGCAAGAGAGACAAGGCCAAT/C0.36
F: CTGCAAGAGAGACAAGGCCAG
R: CCCATTCTCTATGACTCACTCTCCAA
Bol1-20110421763F: GAAGAAAAGACTACAAGAGGACTGAAT/C0.36
F: GAAGAAAAGACTACAAGAGGACTGAG
R: GCAGAGATTCCATGGGTCTCTTGTT
Bol1-31117385144F: AAATAAACATGTGAAATTTATATATTTTGTGACC/T0.37
F: AAATAAACATGTGAAATTTATATATTTTGTGAT
R: CCAGGCAAATTAACCTCATTTAATTTTTA
Bol1-50131515139F: CAACATTATTATTAAAATAAAGAAACTGCAGGTT/C0.37
F: AACATTATTATTAAAATAAAGAAACTGCAGGC
R: CCGAAGCCTTAGAACTCATCTGAGTA
Bol1-57137692928F: ACAAGTCGAAGCAGAAGACAGTATCG/A0.36
F: AACAAGTCGAAGCAGAAGACAGTATT
R: CGTGACTCGAATCTGTAACATTGTTCTTA
Bol2-20211815525F: TGAAGTGACGAGATATTCTGGG/A0.37
F: CGCTTGAAGTGACGAGATATTCTGA
R: TAAAGCGAAAGCCAACAGCGAGGTT
Bol2-23214119719F: CACTCATTGTTTGACGAACTTTATGTGAT/G0.37
F: ACTCATTGTTTGACGAACTTTATGTGC
R: TTATGCAACAAACATAGGAGATGGCTCAA
Bol2-42229630462F: ATCGTGGAAACCAATCAGTTTGCGC/T0.36
F: ATATCGTGGAAACCAATCAGTTTGCA
R: GGCTCCTGCACGGATCAAATACAAT
Bol2-52238362631F: TGCTAGAGAAGTCTCAAGAACACG/A0.36
F: CCTTGCTAGAGAAGTCTCAAGAACAT
R: GCATCATCTGGGCTCCTCTGTTTTA
Bol2-56242324031F: TATTATAATAAAAAGAACACAAGAAATAACTGG/A0.38
F: ATTATAATAAAAAGAACACAAGAAATAACTA
R: GTCAGTTTGTGCATCCTTAATAACACAAAT
Bol3-23572949F: CAACTTCAGCTTCAATGGATTGTCCTT/C0.37
F: AACTTCAGCTTCAATGGATTGTCCC
R: CACAAATAGCAGAACTGCAGAAAGCATT
Bol3-12310349815F: CCACACAGACGAACGAACTTTTGAAT/A0.36
F: CCACACAGACGAACGAACTTTTGAT
R: TTTACGCAGGGGAGGGTTTGGATTA
Bol3-21319333749F: TCTTGCACTGATGGCAAGTCAAGC/T0.37
F: GTTCTTGCACTGATGGCAAGTCAAA
R: TTGCAGGATGATAACTCTGATGGAACAAA
名称
Name
染色体
Chromosome
位置
Position(bp)
引物序列
Sequence of primer (5′-3′)
变异类型
Alleles type
PIC
Bol3-36332861302F: CTTCAAAATTAACCAAGAAATATGAACATACG/C0.37
F: CTTCAAAATTAACCAAGAAATATGAACATAG
R: GTTATCTCCCTAATCTGTTATCTCCTCTA
Bol3-43340497522F: GTCGTTGATTAAGGTAGGAGAAGCC/T0.37
F: GTCGTTGATTAAGGTAGGAGAAGT
R: CTGATTTCCTCCTCGGAACCAACAT
Bol3-52350577875F: GACACATCGTATTCTGAGGATGAAGG/T0.37
F: AAGACACATCGTATTCTGAGGATGAAT
R: CCACTGATCATACAGTTCACAGTACTTT
Bol4-142284389F: ATTAAGTTATTCTTAAAACTCACACATTAGTAGG/C0.36
F: AAGTTATTCTTAAAACTCACACATTAGTAC
R: CCAATCTTAGAGATAATATAGCCCATGATT
Bol4-1049227821F: ATCGAAGTTATTGGTGGCTGTAAGGC/T0.37
F: GATCGAAGTTATTGGTGGCTGTAAGA
R: TCTTTGGAACATCATCTCTACGTACCTTT
Bol4-17414041102F: ATCCTTGCACAAGGTCCTTGCGC/T0.37
F: AAATCCTTGCACAAGGTCCTTGCA
R: AACAATTTCGAGAGTGATCCTGAGGAATT
Bol4-30423412413F: GGTTGAGGATTACTCTGAGGCTCC/A0.37
F: GGTTGAGGATTACTCTGAGGCTA
R: CAACAGTGATCTCTTCACCTCCTGAA
Bol4-42430318761F: GTCATCAGTCCACGCTGGAATGC/G0.37
F: GTCATCAGTCCACGCTGGAATC
R: GATGGTAGACTCCAGACGAGTTCTT
Bol4-52437907183F: ATGAGCAATATTAGTAATCAAAGTCATGCC/A0.37
F: GATGAGCAATATTAGTAATCAAAGTCATGA
R: CTGCTCTCGATGGTATGCAATAGTTTAAA
Bol5-15179080F: AGGATTGAGATGGCTCGAAAATAAGATT/C0.36
F: GAGATGGCTCGAAAATAAGAC
R: CGAAATCAAGGTACCTACTACTTTGCTAA
Bol5-23513597610F: TATATCTTTTTGGTCAAAAGTTTATGCATTAAA/G0.36
F: ATATCTTTTTGGTCAAAAGTTTATGCATTAG
R: CCATGTCCTAATCAAAAGAATCAAATCCAA
Bol5-26515649112F: GTTTTTGTGTGGTTCGTCTGGTCAT/A0.37
F: GTTTTTGTGTGGTTCGTCTGGTCT
R: AGATACAATAGAGCCCCCACATTTGTAAT
Bol5-32519285540F: CAATTTTTAGTGATATACCAAAGTCTGCTTTT/C0.37
F: AATTTTTAGTGATATACCAAAGTCTGCTTC
R: GACATCATTATAGCTTTCACTGATGTTGTT
Bol5-42527307916F: CAAATAAAGACTTGTTCAACCTCCTATCG/T0.36
名称
Name
染色体
Chromosome
位置
Position(bp)
引物序列
Sequence of primer (5′-3′)
变异类型
Alleles type
PIC
F: ACAAATAAAGACTTGTTCAACCTCCTATA
R: GGTCTGAGTTTGAATAAGTCCCCCTT
Bol6-461518700F: GAGCTAACTACCTCGATTATTTATTTATTTATA/C0.37
F: GAGCTAACTACCTCGATTATTTATTTATTTAG
R: CTGTTGGCTTCTACCAGGTAAATTCAATA
Bol6-1368365364F: TATTACTATTTTGTTCATTTGTTTATTTTAAT/A0.37
F: CTTATTACTATTTTGTTCATTTGTTTATTTTAT
R: CACTTTTTAACATGTACAAAATGGAAAATT
Bol6-22614958187F: AGAGTTAATTAATACAATAAATAGTAAATTTCAT/C0.36
F: AGAGTTAATTAATACAATAAATAGTAAATTTCG
R: GGTCATCCGATTATATTGATTACGGTTAAT
Bol6-37625031015F: TCAACGTAAACAAACAAACATTCACATCAT/C0.37
F: CAACGTAAACAAACAAACATTCACATCG
R: CTCTCTCTTTCTCTCTGTATATTCACAAAA
Bol6-46631431471F: CCACCTCTTCTAGGAGATGCATGC/T0.37
F: CCACCTCTTCTAGGAGATGCATA
R: AGCCCCGACGTGATCATCGCAA
Bol6-54638213660F: GTCCAAATCCCATGGAAATATTTGAAAAA/T0.37
F: GTCCAAATCCCATGGAAATATTTGAAAT
R: ATCATCATTTCACGACCGTTGTTGGTTT
Bol7-573897328F: GTGTATGTATTAATGAGTCAACACATCCC/G0.36
F: GTGTATGTATTAATGAGTCAACACATCG
R: GGAATTGGTCAAACCACTAATTTGATTGTA
Bol7-21718794441F: AGCCGCCTAGTTTATGTCGTCTTA/G0.37
F: GCCGCCTAGTTTATGTCGTCTC
R: GGCTTATCGGCCCAGCGAGTTA
Bol7-31727199113F: AAGAATTATTACCATTTACATTATTATGTGATGG/T0.36
F: AAGAATTATTACCATTTACATTATTATGTGATT
R: GTGCAACACAAATATACAGGATTAGCTGAA
Bol7-40733905766F: AAATTTAAAGAGGCGATTGTGGCCAAA/G0.37
F: AATTTAAAGAGGCGATTGTGGCCAG
R: GAACACAATACGTAACCATAATTCTCTGAT
BolIn-B738826795F: CCTTTAATGAGTTGAATCAAATGGTGAAA/-0.37
F: CCTTTAATGAGTTGAATCAAATGGTGAT
R: GAACTTCAGAAGGATCAACGTTGTAGAAA
Bol7-54746200440F: ATGCCTCTTCTCTCTTTCTCCTGAAT/C0.37
F: GCCTCTTCTCTCTTTCTCCTGAG
R: GAAACTAAAAGTGACACACGGAAGATGTT
Bol8-181046990F: GAGGTTATCATCTTGACCTTACCATAT/A0.37
F: GAGGTTATCATCTTGACCTTACCATT
名称
Name
染色体
Chromosome
位置
Position(bp)
引物序列
Sequence of primer (5′-3′)
变异类型
Alleles type
PIC
R: AGCTACAAAACTCCGTCAAAAACGCTTAT
Bol8-11817295300F: GTCAAATGGGCTATAGATCATTAGACTTAT/C0.35
F: CAAATGGGCTATAGATCATTAGACTTG
R: GAAACTGTTTCTTTGCATCTGCCAACAAA
Bol8-26827133960F: ACCAGTGGATGTTTCTGATGGGAG/A0.36
F: CCAGTGGATGTTTCTGATGGGG
R: GCTGGAGAGATATTGGCATTCTTTAGTTT
Bol8-35834047383F: AATATGATCTACAACGCGCTGCCC/T0.36
F: GAATATGATCTACAACGCGCTGCT
R: GTTGAAGGGACATAAGTGTTCCATACTT
Bol8-40837116007F: GAGAAGGAGCTCTCTGGTCTAA/G0.37
F: GAGAAGGAGCTCTCTGGTCTG
R: TGATAACACGGAGAAATCAGGGGGT
Bol8-43839508393F: ACTATAGAAAGTGTCTATACTAATTAGAGTTAT/G0.36
F: CTATAGAAAGTGTCTATACTAATTAGAGTTC
R: TGGTTTGAATGAAGATCGCTAAAGTAAATA
Bol9-29732156F: GGGTCTTCGACGTTTGTTTCTTGAT/G0.37
F: GGTCTTCGACGTTTGTTTCTTGC
R: AACAGAGAAACAAGAGAGTTCCATTCCAA
Bol9-1298645093F: AAATAAAAGAAGTTTGATGAAGATGGGGTT/A0.36
F: AAATAAAAGAAGTTTGATGAAGATGGGGA
R: TTTAATGGTTTTCCTTCTGTGCCTTATCAA
Bol9-31929633956F: ATTTACATTGTTACAAAATCAATCTCACAGTTTT/A0.36
F: TACATTGTTACAAAATCAATCTCACAGTTA
R: CAAGCTAAAGCACCCACTATGAAATTGAT
Bol9-42934784844F: CCAAAATGACATGATTGGCTCAAAATTTTT/C0.37
F: CCAAAATGACATGATTGGCTCAAAATTTC
R: GCAAAGCAGTTAAGGCAATTAACAACGAA
Bol9-44937947752F: CAAACTTCTTGAGATCTCTGGTCCG/T0.37
F: CCAAACTTCTTGAGATCTCTGGTCA
R: TGATGAGTCACCACGTCGACAACAT

变异类型表示野生型/突变型Alleles type indicates the wild-type /mutant genotype
新窗口打开
将59个主要品种的核心位点分型结果转化为二元编码数据,得到主要甘蓝品种的指纹图谱(表2)。参考甘蓝SSR-DNA指纹鉴定技术流程,品种间差异位点数≥2则可判定为不同品种。利用50个核心SNP位点构建的指纹图谱,各品种间差异位点数均≥2,因此,利用该DNA指纹图谱可对甘蓝品种进行有效区分。
Table 2
表2
表2中国59份主要甘蓝品种的SNP-DNA指纹图谱数据库
Table 2SNP-DNA Finger-printing database of 59 main cabbage varieties from China
SNP名称
SNP allele
0102030405060708091011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859
Bol1-1101011111110101101010110110111111010011111001100110110010000
11111101011110111101111011001110111111111111111111111111111
Bol1-2001111111111110010111110110111111111111111111111111111111111
10011011101001111110111101001011011111011101101000110110011
Bol1-3111100111111110111111110111111111011111111111101011000110011
00111110101111101011111010001000110011001011111100111011100
Bol1-5011100111111111111111111111111111111111111111111111001111111
11111111111111111111111111111111111111111111111111111111111
Bol1-5711000011111111111011011111110110111111101111111111111111111
11111101111100011110110001011011000001011100001011000111111
Bol2-2000011111110101111011110110111001111111111001100100111010010
11111101011011101101101111101111111111001111111111001111101
Bol2-2300111111100101111010110100111001010001111001100100111010010
11100001011110001101101111101111111110100111111111001111101
Bol2-4210010010111101000111110111111010110100111100110111111100001
01111101011111111011111111111111111111111111111011000011111
Bol2-5201011111100100011010110100111101110011111100000010010110111
10111101011111110101101011000111001111111111111111111101111
Bol2-5601011111110111111011111010011101111111111011011111000110010
11111111111111110100111101100110100010010100111011111111111
Bol3-211111111111101011011110010011011110011111110000011110110011
11000001011011111100101111101110111111101011111111111111110
Bol3-1200000111010110110011010110111111110011111010110100111110010
11111101111011101110101011101111111101111111111111110111101
Bol3-2101000111000110011011011111111101111111111011010101111111100
SNP名称
SNP allele
0102030405060708091011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859
11111111111011111111110011011011010001000101101111111111111
Bol3-3610111111111111111011111110110111100010010010111101110001110
11100110111101111101110101111011011111111101101111111111111
Bol3-4301101011010111110011011100111111010011111111010110000111011
10111111111111111110100011100111111110110111111111111101111
Bol3-5210011010010111110011011010110110111011111111110111111011110
11111111101110011111110111111011111111011111101011001110111
Bol4-100011111100111111010111110111101110011111011001001000001111
11111111111101111101111111001111111100110101111111111111111
Bol4-1000111111110011101111101110110111011111111011011110001000000
11100111011111110100010011011111111111111110111011111111111
Bol4-1711111111111111110110111101111011100111111111110111111111111
11000000110111111011111111101110111110110111111111011110011
Bol4-3011111111111010111111011111110111111110100111111110001111111
01000111100101111111110010011101111011111001111101111111110
Bol4-4211111111111101110110000001111010110001101101110011111111111
11000111111110011111111111111111111111111111011111001100111
Bol4-5210111111111111111111111111111001101111111001101000011110010
01100001110011000101101010001111111110100110111111111111101
Bol5-111000011000111101011001011010000111101101011111101011001100
11111111111100111110111111111111100111011110100010111110011
Bol5-2300011010101101111010110101110001110001111011110100111011110
11111111111110011101111111111111011111111111011111001110011
Bol5-2611110011111010001011001111111110111110100111111010111111101
00111111110101111111111100111101010011011001111101110111010
Bol5-3211111111111010111111101111111111111110110101110111111110111
SNP名称
SNP allele
0102030405060708091011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859
11001111111101111011111010011111110101011111011101111011110
Bol5-4210011010110111111010110111111100111110110001111111011110111
11111111111111111101111111111111111011111111110111111111111
Bol6-400111111100100111110111010011101000001111010101001001110011
11000000011111000001000101101010111110100111110111111001100
Bol6-1310011010111011001011101111111111111110110110101111110111101
11111111111111110101110101111011101111111101110111111111011
Bol6-2211111111111111011011011111111101111111111111011101111111111
11100000111011111110101101100010010111101101101111111110011
Bol6-3701111111011111110111110001011111110011011111101111111010011
11000001101000001111111111101101111110110011111111001111101
Bol6-4611011111001110111110111001011001011101111001111001001111111
11111101111101100101111110101110110011011111111111111111001
Bol6-5411111010111111000111111111111110110010100110111011111111001
11111111111111111011111101111001011111111111111100001111111
Bol7-500111111101100011010110100111101100011111110010100000111111
11100000111111111101111111111110111111101111111011111111111
Bol7-2111011010111101101010111111111111110111111111011101111011100
11111111111110111101111011011111011111111101110110111110011
Bol7-3111111111011111101111101111110111111111100111111101111111101
11111111111100111110110101111011000011011100100110000110111
Bol7-4011010011011010110111111111111111001110100111111111001100010
01111101100101111010111010010111110011011111110111111111111
BolIn-B00111111111111111010111110111111010111011010111101111110111
11111010111011101111101001011010101101101101010011001111101
SNP名称
SNP allele
0102030405060708091011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859
Bol7-5400011111100101111011111111111101011111111011110100000110011
11111100111111000101101111101110111110100111011011111111101
Bol8-111001011011111100111101110111111111111111111111111001111101
11111110111101111111110001011010101101111100100010111110111
Bol8-1111111011011111111111111111111111011111111111011101000111111
01111110110101111011110010011110100000000100100111111010110
Bol8-2611111111010000111011101011110101101010110011101101111011110
11100111111111110111111111111110111111011111011111101111111
Bol8-3500000111011111110011011010011111001111111011011101110001111
11111111111110111111100101101111111110110101111111111111111
Bol8-4011100011111001111111101111111110111111101111101011001111111
00111111100111011011110000011001111101011110111111111111010
Bol8-4310111111111110001111111111111101111110010010011101111111101
01000100110101110100110001011110101001111101111011000011011
Bol9-211111111111110111010011110111110111111111110111111011011111
11000011011111101111110101111111111111111001000111111101110
Bol9-1211111111111110010111110101111110101111111100011111111111111
01000011110001111010101011001101111111011011101101111010010
Bol9-3101001110000100110011011111111110001111111010111001001001010
11110001111011101110111111101111111111011111110111111111101
Bol9-4210111111010101111010011111111101110011111111110101111011110
11100111111110011111111101111110001101111101001111001110011
Bol9-4410111110111111110011011110111010011111101111111111111001011
11110111111110011111111111111111111011111111000110000111111


新窗口打开

2.3 主要甘蓝品种的聚类分析

根据50个核心位点的分型结果,利用NTSYS软件对59个供试品种进行聚类分析(图3)。结果表明,育成品种两两间的遗传相似系数为0.43—0.98。其中,‘秦甘78号’与‘争春’的遗传相似系数最小,为0.43,二者之间存在41个差异标记,这说明二者亲缘关系最远。而‘中甘21’与‘中甘628’的遗传相似系数最大,为0.98,二者之间的差异标记仅有2个,说明它们的遗传背景很相似。分析‘中甘21’与‘中甘628’的系谱发现,二者的父本完全相同,母本都是圆球春甘蓝材料。
显示原图|下载原图ZIP|生成PPT
图359个主要甘蓝品种的SNP聚类分析图
图中编号同电子附表1 The core in Fig. 3 was same as Table 1

-->Fig. 3Cluster analysis dendrogram based on SNP for 59 main cabbage varieties
-->

在遗传相似系数0.60处,可将所有供试品种分为两大类群。第一大类群共包含33个品种,在遗传相似系数0.64处可划分为3个亚类,‘中甘8号’、‘晚丰’等11个品种为第1亚类;‘春丰’、‘博春’为第2亚类;第3亚类包含‘春甘2号’、‘争春’等在内的20个品种。第二大类主要为圆球或近圆球类型甘蓝,共25个品种,在遗传相似系数0.61处可划分为2个亚类,将其命名为第4亚类与第5亚类。其中,第4亚类包含21个品种;第5亚类包含5个品种。聚类分析的结果与供试品种的来源有很强的相关性,例如:山西省农业科学院育成的惠丰系列甘蓝、河南省农业科学院育成的豫甘系列甘蓝、江苏镇江农业科学研究所育成的瑞甘系列甘蓝,上述单位培育的一系列甘蓝品种之间呈现较近的亲缘关系,聚类分析时聚在一起。结果表明,SNP聚类结果与供试品种的表型性状和地理来源相一致,能准确的反映供试品种的亲缘关系。

2.4 核心标记在品种鉴定中应用

通过人工构建的虚拟混合群体对DNA指纹图谱的核心位点进行验证,利用50个核心SNP标记对虚拟混合群体进行基因分型检测,并与已构建的DNA指纹图谱进行比对。基因分型结果显示:虚拟混合群体中来源于同一品种的3个样品其分型结果完全相同,这说明核心SNP标记具有较好的重复性。虚拟混合群体中有45个样品(15个品种)的分型结果与DNA指纹图谱中相应品种完全对应。剩余的15个样品(5个新组合),与指纹库中材料均表现出较大差异(差异位点数>2),在指纹库中无对应品种。结果表明,利用50个核心SNP标记可实现对甘蓝品种真实性和特异性的有效鉴定。

3 讨论

3.1 主要甘蓝品种的代表性

目前,中国甘蓝种植面积约90万hm2[20,21],在蔬菜周年供应中占据重要地位。中国甘蓝品种选育开始于20世纪50年代、70年代以后得到快速发展。目前市场上审定推广的甘蓝品种大都为一代杂种,一代杂种的种植面积占总种植面积的90%以上[21]
本试验中所选用的59个甘蓝品种全为一代杂种。在59个甘蓝品种中,年推广面积曾达到1×104 hm2以上[23]且目前还有大面积种植的品种就有十几个,如‘京丰一号’、‘8398’、‘中甘21’、‘晚丰’、‘庆丰’、‘中甘15’、‘中甘11’、‘春丰’、‘争春’、‘西园四号’等,这些品种占到国内甘蓝种植面积的60%—70%[24]。本试验中所选的59个主要甘蓝品种涵盖了不同球型(圆球、扁球、牛心型)、不同栽培季节(春甘蓝、秋甘蓝、越冬甘蓝)及不同熟性(早、中、晚熟),这些品种具有广泛的代表性。

3.2 基于SNP位点构建DNA指纹图谱

DNA指纹图谱技术(DNA-Fingerprinting)是由英国科学家Jeffreys于1986年开发,具有快速、准确等优点,是鉴别品种、品系的有力工具,已广泛应用于很多作物的品种资源多样性和纯度鉴定研究,陆续将RFLP、AFLP、SSR、SNP等标记技术用于构建DNA指纹图谱。其中,SSR指纹技术由于其重复性好、简单易于操作、且大多数为共显性标记,常用于品种鉴定分析,已在水稻[25]、玉米[26]、柑橘[27]、甜瓜[28]等多种作物中得到应用。在甘蓝中,基于SSR标记已建立了50个代表品种的指纹图谱,并制定了SSR分子标记法进行甘蓝品种鉴定的技术规程(标准号:NY/T 2473-2013)。但SSR标记在实际使用中也暴露出一些不足,如标记数量有限、检测位点少,位点存在一定的突变率、对变异反应比较敏感等。SNP指纹技术是继RFLP和SSR之后发展起来的第3代标记技术,具有数量多、分布广泛、稳定性高、易于快速且高通量地进行基因型分型等优点[8]。与SSR相比,SNP是基于单核苷酸的突变,突变频率更低,遗传稳定性更高。SNP标记是构建DNA指纹数据库的推荐标记之一,但是目前甘蓝中尚没有基于SNP标记的指纹图谱。因此,构建基于SNP标记技术的指纹图谱对于甘蓝品种特异性和真实性鉴别、种子纯度鉴定具有重要意义。
随着SNP检测技术的不断进步,SNP标记的检测成本也逐步降低。相对于SSR标记,目前高通量大样本的SNP标记检测已显现出优势。今后随着品种数量的增多、品种指纹图谱数据库的进一步丰富,高通量的SNP检测技术在新育成品种的真实性、特异性鉴定方面将具有非常广阔的应用前景。

3.3 利用核心标记构建SNP-DNA指纹图谱

指纹图谱核心标记的选择视物种基因组的复杂程度、标记类型、标记检测技术、品种数量等情况而定。匡猛等[29]利用36对SSR引物作为核心标记,构建了32个棉花主栽品种的指纹图谱。王立新[30]在小麦品种鉴定中提出使用21对核心引物、84对备用引物进行指纹研究。王庆彪等[5]使用20对核心引物构建了50个甘蓝品种的EST-SSR指纹图谱,利用其中8对多态性较好的引物便可将50个品种全部区分开。因此对于不同物种,构建指纹图谱的核心标记数量应视物种基因组复杂程度而定。SSR标记数量丰富、多态性高、呈共显性,可鉴别杂合子和纯合子,可用少量标记鉴别大量物种。与SSR标记不同,SNP标记虽然稳定性高但呈二态性,单个标记的多态性信息含量较低,鉴别相同数量品种所需要的标记数多于SSR标记。本研究中,筛选出了50个核心SNP位点用于主要甘蓝品种的指纹图谱构建,由于SNP标记的二态性,理论上每个标记可区分的杂交种数N1=3,本研究中选取得50个标记可区分的最大杂交种数N=3^50=7.18×1023,出现相同指纹图谱的概率P=1.39×10-24。因此,理论上而言,利用50个核心SNP标记构建甘蓝主要品种的指纹图谱是完全可行的。
SNP-DNA指纹图谱的构建方式也与SNP检测方法有关。目前常用的SNP检测及分型的方法主要有以下几种,基于凝胶电泳检测的等位基因特异性PCR[31]、单链构象多态性[32]、酶切扩增多态性序列法[33]等;高通量自动化检测的直接测序法、DNA芯片技术[34]、竞争性等位基因特异性PCR[17]等。等位基因特异性PCR、酶切扩增多态性序列法等SNP检测方法由于其操作繁琐、准确率较低,不适用于构建指纹图谱。目前,利用DNA 芯片技术是检测 SNP 的最常用方法,已在玉米[14]、油菜[15]等作物的指纹图谱构建中得到应用。利用DNA芯片技术可直接进行指纹图谱构建,不需要进行核心标记筛选,但该方法制作DNA指纹图谱的成本较高。相比于DNA芯片技术,利用KASP技术进行SNP检测的成本较低,其成本与检测的SNP位点数呈正相关。从发展趋势来看,近年来随着甘蓝基因组重测序的陆续开展,越来越多的SNP标记得到开发,加上SNP标记相比SSR标记的一些优势,将来会更多地依赖于SNP标记进行品种的特异性、真实性鉴定。本研究中,利用KASP技术进行SNP检测并筛选出50个核心SNP位点用于构建59个主要甘蓝品种的指纹图谱,随着育种技术的发展、育成品种数量的增多,也有可能还需要增加SNP标记,尤其是与重要农艺性状紧密关联的SNP标记,以更准确、高效地检测出品种的真实性、特异性。同时,希望可以为新品种保护授权提供前期的鉴定工作,利用指纹图谱对品种进行初步鉴定,最终结合田间表型鉴定判定品种的特异性、真实性。

4 结论

利用50份甘蓝高代自交系重测序数据进行比对,共开发2.54×106个SNP位点。将442个SNP位点成功转化为KASP标记,并从中开发出一套适用于中国甘蓝品种指纹图谱构建的核心SNP组合,构建了中国59个甘蓝品种指纹图谱数据库。通过人工构建模拟群体验证,证明核心SNP组合可实现对甘蓝品种真实性和特异性的有效鉴定。
The authors have declared that no competing interests exist.

参考文献 原文顺序
文献年度倒序
文中引用次数倒序
被引期刊影响因子

相关话题/鉴定 技术 材料 遗传 种子