Retrospect and prospect of the genetic research on birth defects
in China
Liya Sun

编委: 史庆华
作者简介 About authors

2012年9月,原国家卫生部发布的《中国出生缺陷防治报告》将“出生缺陷”定义为对婴儿出生前发生的身体结构、功能或代谢等方面异常的一种统称,通常包括先天畸形、染色体异常、遗传代谢性疾病以及功能异常如盲、聋和智力障碍等。目前已知的出生缺陷类疾病至少有8000~10000种,据在线人类孟德尔遗传数据库(Online Mendelian Inheritance in Man, OMIM)统计(截至2018年8月30日),其中有5208种孟德尔单基因疾病(或特征)已经发现了明确的致病基因(涉及3575个基因)。截至2012年,我国出生缺陷总发生率约为5.6%,处于中等收入国家水平,但由于人口基数大,每年新增出生缺陷病例高达约90万例,相当于每30秒就有1名出生缺陷患儿出生[2]。《中国出生缺陷防治报告》中显示,2011年我国最常见的5类围产期出生缺陷疾病分别为先天性心脏病、多指(趾)、总唇裂、脑积水和马蹄内翻。2015年10月,党的十八届五中全会正式宣布“全面放开二胎”政策,随着社会发展而伴发的婚龄孕龄的逐渐推迟导致高龄产妇逐年增加,进一步增加了潜在的出生缺陷发生率。出生缺陷儿童的死亡率极高,约30%会在5岁之前死亡[3]。2012年中国城市和农村小于1岁的居民疾病死因构成比中,“先天畸形、变形和染色体异常”类的因素占近1/4[4]。约40%的出生缺陷儿童会发展为终身残疾,其中肢体残疾、听力残疾和智力残疾是主要类型,严重影响儿童的生命和生活质量,也给家庭和社会带来沉重的精神和经济负担[3]。此外,在对2000~ 2015年间全球各国小于5岁儿童的死亡率分析中发现,死亡率越低的国家(通常是发达国家),先天畸形等出生缺陷所致儿童死亡的比例越高,可见减少出生缺陷是世界各国共同面临的挑战[5]。
出生缺陷的病因多种多样,其作用时间窗口位于出生前的受精卵形成及胎儿发育的时期。这些病因大致可分为遗传因素和环境因素。据估计,由遗传因素为主所致的出生缺陷占比约20%~30%,由环境因素(如母体疾病、营养不足、宫内病原体感染或环境有害化学物质、药物或射线等因素)所致的出生缺陷占比约10%,而剩余的60%~70%的出生缺陷多是由遗传和环境因素共同作用的结果[6]。因此,遗传因素直接或间接地导致了超过80%的出生缺陷,遗传学病因研究是出生缺陷防治工作的关键基础。相较于成人疾病,开展出生缺陷类的遗传学病因研究有其自身明显的优势:(1) 绝大部分出生缺陷在婴儿刚出生或儿童时期即会表现出相关的临床症状,进而被鉴别和诊断,因此出生缺陷的发生受后天环境影响少;(2) 个体层面的致病因素(无论是环境因素还是遗传因素)往往与发育密切相关,且具有较强的致病效应。近半个世纪以来,国内外的遗传学研究者已经成功鉴定了几千种出生缺陷类疾病的遗传学病因,为出生缺陷防控提供了有力的技术支撑。出生缺陷可以说是临床医学遗传学的前沿阵地和人类遗传学知识的资源宝库。本文首先回顾了我国出生缺陷遗传学的研究历史,继而介绍当前国内外出生缺陷遗传学研究的现状和热点,最后对未来的研究方向及相关的临床应用趋势进行展望和讨论,为读者提供一个相对全局性的视角来了解我国出生缺陷的遗传学研究概况。
1 我国出生缺陷遗传学研究历史回顾
我国出生缺陷遗传学研究的正式起航可以追溯至20世纪60年代,主要分为两个阶段:(1) 学习跟踪阶段。1962年,中国****吴旻从苏联学成回国后,发表了中国人类染色体的组型,并率先把对染色体组型的观察用于人类疾病研究,开创了国内的临床细胞遗传学研究领域[7]。1963年,上海儿童医院苏祖斐报告了出生缺陷中唐氏综合征患儿的染色体研究结果,发现21号染色体三体是该病的致病病因。同年,中国医学科学院詹宝光和吴旻在对羊水细胞中性染色质的检查中确认了一例XXY性染色体异常患者。从此,全国各地陆续开展了大量的出生缺陷相关的染色体异常检查和临床应用。1972年,中南大学夏家辉等向国内引进了国际上1971年建立的人类染色体G显带技术;1979年进一步引进了国际上1977年建立的人类染色体高分辨技术,并于1981年运用染色体高分辨技术将睾丸决定基因TDF定位在Y染色体的p11.32区域,为先天性性器官发育缺陷提供了重要的遗传学依据。继1983年的工作,他们于1990年报道了运用各种染色体技术在产前诊断中发现的约1200种染色体异常,引起了国内外的广泛关注。1984年,中国医学科学院宿远和吴旻提出了人类高分辨显带核型模式图,使我国的染色体显带研究进入微细胞遗传学领域。1986年,夏家辉等提出将1985年美国发现的PCR与染色体显微切割技术相结合,建立定点克隆基因的技术。这一尝试将我国出生缺陷遗传学研究从染色体水平进一步精细化到基因水平,并将主要的研究样本从遗传突变细胞拓展到家系样本[8]。此外,在临床转化方面,上海交通大学曾溢滔自1978年起发展了一整套遗传病分子诊断技术,先后攻克了地中海贫血、苯丙酮尿症、杜氏肌萎缩症、血友病和亨廷顿舞蹈症等国内主要遗传病的临床诊断和产前诊断,有力推动了我国遗传诊断学科的发展;
(2) 引领国际前沿发展。突破的契机往往在于对最新资源的及时把握和有效运用。1987年,美国能源部与国家健康研究院(National Institutes of Health, NIH)启动了“人类基因组计划”,无疑对出生缺陷的解决注入一剂兴奋剂。中国也承担了其中1%的任务[9]。1998年,夏家辉团队在中国的出生缺陷遗传家系中率先发现了具有新功能的神经性耳聋的致病基因GJB3,这一工作发表在具有国际重要影响力的专业杂志Nature Genetics[10]上。
中华民族包含相对独立通婚的56个民族,其中55个为少数民族,加上中国人民安土重迁的文化性格,使得这片土地孕育生养着很多大家族,因此我国保留有丰富的遗传家系资源。2000年前后,国内的遗传学研究者充分运用国内独有的样本资源,同时利用“人类基因组计划”的研究成果,再结合国际先进的分析方法,为中国出生缺陷的遗传学研究迎来了百花齐放的春天(图1)[12]。1996年,上海交通大学贺林团队首先把精力放在揭示A-1型短指(趾)症的研究上。A-1型短指(趾)症是1903年报道的世界上第一例孟德尔常染色体显性遗传病,被遗传学和生物学教科书广为引用,倍受世人关注,但近百年来也未鉴定其致病基因。贺林团队在中国家系样本中运用连锁分析方法,率先完成了致病基因IHH的精确定位、克隆与突变检测,还开展了后续的功能研究,相关成果分别于2000年、2001年和2009年发表在American Journal of Human Genetics[13]、Nature Genetics[14]和Nature[15]上,这是我国出生缺陷遗传学研究里程碑式的成果,体现了我国在该领域的引领地位。另外,贺林团队还对出生缺陷“贺-赵缺陷症”做出了积极的贡献。“贺-赵缺陷症”又称“家族性恒齿缺失”,由陕西省中学教师赵双民与内科医生赵万里于1985年首先发现[16]。2001年,贺林团队成功对该病的致病基因进行了精确定位,使该病成为国际上首次以中国人姓氏命名的遗传疾病[17]。中国医学科学院沈岩团队也于2001年在世界上首次定位并克隆了DSPP基因,发现其为遗传性乳光牙本质的致病基因[18];同年,中国科学院上海生命科学研究院孔祥银团队在遗传性牙本质发育不全Ⅰ型的疾病家系中也克隆了DSPP基因,发现该基因的部分突变还会引起进行性高频耳聋,建立了牙齿发育和内耳发育之间的联系,表明同一致病基因可以引发多种疾病表型[19]。这两项研究都相继发表在当年的Nature Genetics上。2002年,孔祥银团队再次在该杂志报道了成功定位并克隆遗传性儿童白内障的致病基因HSF4的工作,发现遗传突变会影响HSF4蛋白的DNA结合区功能,在白内障发病过程中具有重要作用[20]。2003年,同济大学医学遗传研究所陈义汉和国家人类基因组南方研究中心的徐世杰合作,他们在一个家族性房颤大家系中定位并克隆了致病基因KCNQ1,并在后续的功能学研究中发现该基因的致病突变(S140G)是通过改变动作电位时长引发房颤,这一研究成果发表在Science上[21]。在国内遗传学家的共同努力下,以上述优秀工作为代表的中国出生缺陷遗传学研究在21世纪伊始便走在了世界先进行列[11]。此后,复旦大学邢清和[22]、王红艳[23]和王磊[24],中国医学科学院张学[25],南方医科大学徐湘民[26],解放军总医院王秋菊[27]和袁慧军[28]等一批****亦为此领域分别做了重要贡献。

Fig. 1Around 2000, China’s genetic research on birth defects experienced a rapid development
2 当前国内外出生缺陷遗传学研究的现状和热点
“人类基因组计划”的实施促进了遗传学检测技术,特别是DNA测序技术的飞速发展,这一发展也给医学遗传学研究模式和效率带来了日新月异的变化[29]。DNA测序技术的发展始于1977年,Sanger等开创的链终止法测序技术标志着人类第一代DNA测序技术的诞生[30]。Sanger测序法准确率高,但是测序通量低,不适用于大规模的筛查,因此早期的出生缺陷遗传学研究多是先采用PCR和电泳技术,对遗传标记进行分型和分析来间接定位候选基因,然后再采用Sanger测序法寻找较小范围内的致病基因及其突变。“人类基因组计划”结束后不久的2005年,美国罗氏公司推出了首款高通量的基因组测序系统—454基因组测序仪,代表了第二代DNA测序技术的诞生[31]。随后市场上相继出现多款高通量测序系统,性能愈加优化,测序成本快速下降。最初个人全基因组的测序费用高达1亿美金,而时至今日同样数据量的人类全基因组只需要1000美金左右。测序技术成本的“亲民化”使得遗传学研究者在面对小规模的疾病样本集,特别是家系样本时,可直接采用全基因组测序(whole genome sequencing, WGS)或全外显子组测序(whole exome sequencing, WES)[32]的策略从基因组水平筛检致病基因及其突变[33]。2.1 单基因突变导致的出生缺陷的研究
阵发性运动源性运动障碍(paroxysmal kinesigenit dyskinesia, PKD)是一种多发于儿童和青少年时期的出生缺陷疾病。2011年,复旦大学吴志英和福建医科大学王柠合作,利用WES技术结合Sanger测序验证的策略,在具有PKD病史的8个汉族家系中鉴别出了PRRT2基因的3个截短突变为该病的致病突变[34]。2015年,德国Maass等[35]利用WGS技术在一个兼具短趾和高血压遗传特征的土耳其大家系中鉴定出了PDE3A基因上的致病突变,并在5个其他民族的独立家系中得到验证。播散性浅表性光线性汗孔角化症(disseminated superfical actinic porokeratosis, DSAP)一般在20~40岁之间发病,是一种常染色体显性遗传病。2012年,安徽医科大学张学军团队利用WES技术并结合功能学研究分别在家系和散发样本中鉴定出MVK基因为DSAP疾病的致病基因之一[36]。2016年,复旦大学的王磊团队利用WES平台在一个由于卵子成熟障碍导致多名女性成员不孕的大家系中发现,TUBB8基因的突变可能是这个家族不孕的遗传学病因。这一发现在其他23个患病家庭中得到验证,并在功能学实验中发现TUBB8基因突变会通过影响微管结构的组装,阻遏卵母细胞的减数分裂,从而导致不孕[24]。可以看出,与基于遗传标记的家系连锁分析策略不同,目前基于新一代测序技术的出生缺陷家系研究,一般是先评估疾病遗传模式(如外显率为100%的常染色体显性遗传),再挑选先证者家系中少数几名诊断明确的患者和正常人开展二代测序(大多为WES),筛选出与表型共分离的功能性罕见遗传突变及其所在基因;然后用Sanger测序等方法靶向鉴定候选基因在其他家系或同种族正常人群中发生突变的情况。那些在验证人群中仍然严格表现为与表型共分离的基因,便是值得进一步开展病理功能学研究的候选致病基因。这个策略对单基因外显子区域的单碱基变异(single nucleotide variant, SNV)或插入缺失突变(insertion and deletion variation, InDel)引发的遗传因素高度外显的家族性出生缺陷疾病尤其有效,而且目前临床上基于WES技术已经能够对相当一部分儿科遗传病做出基因诊断[37](图2)。不过,对于由基因组结构变异(structural variation, SV)或基因拷贝数变异(copy number variations, CNV)[38]引发的出生缺陷疾病或存在外显不全、拟表型、多基因遗传等复杂情况的疾病,则需要基于WGS平台或家族更多成员的连锁分析来进行更为深入的探索[39]。图2

Fig. 2Available diagnostic rates based on whole-exome sequencing in classes of paediatric genomic diseases
2.2 多基因复杂出生缺陷的研究
出生缺陷除了由单基因或单位点的遗传突变引起,还有相当一部分是多基因和环境因素综合作用的结果,如高发的非综合征型先天性心脏病和总唇裂。单基因或单位点遗传疾病的主要研究样本类型为染色体变异细胞系或疾病家系,一般符合“rare diseases rare variants”的致病假设,而对于复杂疾病,国际上曾提出“common disease common variants”的致病假设[40],即疾病的发生与多个相对微效的致病基因或变异有关,由于这些变异的致病性较弱,它们可以在疾病或正常人群中以较高的频率存在,只有当这类变异在个体中累积到一定数量时才会导致疾病发生。群体遗传学中的关联分析是研究这类疾病的常用策略。群体遗传学是计算遗传变异在人群中分布频率的统计性学科,因此为达到足够的统计效力,往往需要对成百上千甚至上万的散发性样本进行遗传变异检测,和测序技术一同发展起来的基因芯片技术在该领域最先得到应用。不同于DNA测序,基因芯片是针对已知位点的靶向性检测。当它与标记数目多、覆盖密度大的第三代遗传多态性标记—单核苷酸多态性(single nucleotide polymerphisms, SNP)结合应用时,可以实现全基因组高分辨率的关联分析(genome wide association study, GWAS)[41]。上海交通大学Bio-X研究院师咏勇课题组将GWAS应用于精神分裂症,发现了一系列中国汉族人群精神分裂症高风险位点,为多基因复杂疾病的研究做出了重要贡献[42, 43]。在出生缺陷疾病方面,2013年南京医科大学沈洪兵团队在4225名先天性心脏畸形患儿和5112名对照的样本集中,采用覆盖90万个SNP位点的基因芯片,检测和定位到染色体1p12位置的SNP rs2474937 (TBX15基因附近)和4q31.1位置的SNP rs1531070 (位于MAML3基因中)与先天性心脏畸形密切相关,表明这两个位点本身或与之相连锁的某些基因变异具有一定的致病性[44]。2015年,南京医科大学的胡志斌团队在6053个先天性心脏畸形病例和7410名对照人群中开展了多阶段的GWAS分析,发现了4个新的全基因组范围内的显著关联位点,其中染色体20q12上PTPRT基因中的rs490514位点在欧洲人群中也表现出一致的关联性[45]。但总的来说,基于高频SNP标记的GWAS研究在出生缺陷类疾病中并不普及,究其原由:一是因为大多数出生缺陷疾病相对发病率低,研究者往往无法收集到满足研究需求的大量样本;二是如前所述,导致出生缺陷的遗传变异的致病效应往往较其他有更多后天因素参与的疾病相关位点的致病效应更为显著,而这类具有较强致病效应的遗传变异由于自然选择,较少以“common variants”的形式在人群中存在,因此在某种程度上可以说,基于基因多态性的GWAS研究对于出生缺陷遗传病因的发现效率有限。事实上,在其他复杂疾病(如精神分裂症[43])的研究中,研究者也发现GWAS研究找到的显著关联的多态性位点往往只能解释疾病遗传因素中的一小部分,相关基因只能称作疾病易感基因,而不是致病基因。因此近年来,越来越多的研究者开始考虑复杂疾病的“common disease, rare variants”的致病研究假设[46],即某些多基因复杂疾病的遗传病因也可能是由几个主效致病基因的罕见突变配合其他微效基因的易感突变共同构成。在这种假设下,能够覆盖各种突变类型的新一代测序技术成为了研究多基因复杂疾病的重要手段[47]。智障是一种在新生儿中发病率约为0.5%的出生缺陷疾病,遗传因素在疾病病因中占据主要地位。2014年,荷兰Joris A. Veltman实验室对50个智障3口之家(子女为智障患者,父母为正常人)的DNA样本进行了全基因组测序,以寻找致病性的遗传突变。最终他们在这些样本中发现了84个新发的(de novo)SNV和8个de novo的CNV[48]。这些变异显著富集在基因编码区域以及已发现的智障相关基因区域。根据测序结果,其中20位患者被诊断为携带显性遗传的de novo致病突变,1位患者被诊断为携带复合杂合致病突变,诊断率达到42%。从这个例子中可以看出,不同于家族聚集性遗传的出生缺陷,散发的复杂性出生缺陷疾病的遗传异质性非常高,体现出“多基因”的特征:对个体患者来说,疾病可能只是由一个或少数几个基因的主效性罕见突变导致,但在群体水平,很多基因上的主效性罕见突变或某个主效基因上的多种突变都可以导致类似的临床表型。迄今为止,研究者在智障患者中已发现超过700个以显性或隐性模式致病的主效基因[37]。美国Michael Wigler实验室于2014年报道了他们在自闭症儿童中的研究,表明高致病性的多基因罕见de novo突变在出生缺陷遗传学中扮演重要作用[49]。他们对2500多个核心家系(患者及其父母)或受累同胞对(患者及其正常的兄弟姐妹)的样本进行WES测序,发现13%的de novo错义突变和43%的de novo潜在基因破坏性突变(likely gene-disrupting mutations, LGM,包括无义、移码和剪切突变),解释了近21%的患儿的遗传性病因,其中约400个基因上的LGM对低智力的自闭症儿童亚群贡献更大。从样本的角度来看,以上两个研究利用的都是核心家系或受累同胞对样本,这类样本能够高效率地发现致病突变,特别是de novo类型的突变。近年来,随着各国加大对测序类遗传研究的投入,在大型散发样本中开展的基于新一代测序技术的疾病-对照研究也发现了一些重要的罕见致病突变[50]。2017年,美国Evan E Eichler实验室在大于11 730例的儿童期神经发育障碍(包括自闭症、智障/精神发育迟滞、注意力缺失/多动症,运动发育障碍和语言交流障碍)患者和大于2867例对照人群中运用二代测序技术靶向检测了208个神经发育相关的候选基因的外显子序列,发现91个基因上的罕见突变与精神发育障碍显著相关,其中25个基因上的罕见突变更倾向于发生在自闭症中。这些突变基因在神经发育障碍疾病中发挥的具体作用还需要功能学实验来做进一步的研究[51]。
3 未来我国出生缺陷遗传学研究和应用展望
自20世纪60年代以来,我国出生缺陷遗传学研究发展迅速,不断取得国际一流水平的工作成果。随着研究者对各类出生缺陷疾病更深入地了解以及对基因检测技术更灵活地运用,目前出生缺陷类疾病的遗传学研究已经可以通过对各研究要素的合理选择以及优化组合来有效地设计思路,挖掘相关病因(表1)。未来我国出生缺陷的遗传学研究和应用工作还有以下几个方面会有进一步的发展和完善:Table 1
表1 出生缺陷遗传学研究要素
Table 1
合理的病因假设 (突变类型和遗传模式假设) | 有效的研究 样本 | 正确的疾病 诊断和全面 的表型描述 | 灵敏准确的检测技术 | 完善的遗传数据库和生物信息学支持 | 充分的验证 实验 |
1. 遗传因素 (1) 染色体异常 染色体数目异常 染色体结构变异(large SVs) 拷贝数变异(CNVs) (2) 单基因突变(SNVs, small InDels) 常染色体显性突变 常染色体隐性突变 X染色体显性突变 X染色体隐性突变 Y染色体显性突变 (3) 非经典孟德尔遗传 线粒体突变 印迹基因突变 其他:嵌合体、单亲二倍体、杂合性缺失等 2. 遗传和环境因素共同作用 (1) 主效基因+微效基因+环境因素模式 (2) 多微效基因+环境因素模式 3. 环境因素 | 1. 较为完整的大家系 2. 数量充足的核心家系 3. 数量充足的同胞对 4. 数量充足的疾病散发 样本 | 1. 严格按照诊断标准进行诊断 2. 结构化的表型描述(HPO表型组计划) | 1. 遗传标记法(间接) (1) 第一代遗传标记(RFLP) (2) 第二代遗传标记(STR) (3) 第三代遗传标记(SNP) 2. 变异扫描法(直接) (1) 核型分析平台 G显带分析 FISH技术 (2) 芯片平台 CGH芯片 SNP芯片 (3) 测序平台 靶向基因测序 全外显子测序(WES) 全基因组学测序(WGS) | 1. DNA序列数据库 同源序列分析 2. 遗传突变数据库 (1) 人群突变频率分析 (2) 突变的生物学效应分析 (3) 突变和疾病表型共分离分析 | 1. 独立样本验证(正常人或疾病样本) 2. 基因表达组织验证 3. 基因突变的病理功能研究 |
(1) 研究样本的分层处理。以先天性心脏病为 例[52],染色体核型异常、基因拷贝数变异、单基因突变以及多基因缺陷均会导致先天性心脏病,先天性心脏疾病作为综合征的疾病表型之一,也可以以单病的形式存在。因此大规模的先天性心脏病散发样本(或独立家系样本)往往具有很高的遗传异质性,这种异质性会增加数据噪声,降低对特定遗传病因的发现效力。若能根据表型谱的相似度或特异性来对疾病样本进行分层纯化处理,则能更有效地发现样本之间共享的遗传变异[37]。
(2) 疾病表型数据的收集和整理。测序技术大大提高了研究者对基因组信息的掌握水平,但在疾病基因组和表型的关联研究中,如此高分辨率的遗传信息需要明确、周全、清晰的疾病表型信息与之相辅相成,才能推进更为客观和精确的发现[53]。为此,国际上的Human Phenotype Ontology (HPO)项目(https://hpo.jax.org)对来自医学文献的表型信息进行结构化归纳,并对表型相关词汇及其语义相互关系进行仔细定义,建立分层关系。截止至2018年3月,HPO数据库已包含了各类遗传疾病的13 000个词条和156 000对“疾病实体-症状词条”的关联注释。2015年至2016年间,华大基因杨焕明和HPO创始人Peter Robinson联合推动成立了中文的人类表型标准用语联盟(The Chinese Human Phenotype Ontology Consortium, CHPO),现已为5271个OMIM词条加入了中文译名(http://www.chinahpo.org)。
(3) 测序技术的发展和优化。目前测序市场产出的多是短读长(如150 bp)的原始数据,这类数据适用于检出SNV和小型InDel,在阅读基因组的高度重复区域和确定长链结构方面还存在缺陷,整合长读长的检测平台进行综合分析是未来的发展趋势。另外,单细胞测序技术的发展也在降低对临床测序DNA样本量的要求[54],它在辅助生殖中胚胎筛选方面的应用也令人振奋[55, 56]。此外,对于常见复杂疾病到底是基于“common variants”还是“rare variants”的假设之争,目前仍未尘埃落定,虽然目前应用于出生缺陷遗传学研究的多为全外显子组测序和目标区域测序[57],随着测序成本的下降,未来基于大样本的深度足够的全基因组测序(能全面检测到各类变异)将得到更多应用。
(4) 多组学检测和精准医学理念的普及。60%~ 70%的出生缺陷是遗传和环境因素相互作用的结 果。因此,遗传变异和疾病表型之间往往不存在简单的对应关系,环境因素在其中扮演重要的调节作用。这种作用在生物体中可以表现为表观基因组的改变、mRNA或蛋白质表达的改变、细胞信号通路或物质代谢通路等多个方面的改变。后基因组时代发展起来的表观基因组学、转录组学、蛋白质组学和代谢组学等技术可以高通量地观察机体在这些层面的改变,从而评估环境和遗传因素在生物体内综合作用的结果,以更好地理解表型产生的机理[58]。精准医学即提倡利用现代高通量的检测技术,更精确地认识疾病成因及其个体化差异,从而设计有针对性的方案实现有效的治疗[59]。此外,上述多个层面之间的数据还可以相互印证和补充,提高临床诊断率。比如运用转录组学,可以在二代测序显示为阴性的患者中额外诊断出21%存在基因转录水平异常的病例[37]。
(5) 疾病相关信息化系统的建立。“人类基因组计划”的实施及其效果已经向世人展示了现代大数据信息资源的重要性。随着各类大型出生缺陷研究项目和临床基因检测服务的开展,巨量的基因组和临床信息数据在日复一日地产出和累积,如何合理地组织、整理、保存、利用以及共享这些宝贵的数据资源是出生缺陷遗传学研究和应用工作的一大挑战:需要不同领域的专家和工作人员之间通力合作,在政府或有关机构的协调下,搭建出整合型的信息学平台,从而使这些公共资源汇集后能够发挥出乘和效应,更好地为我国临床医学事业服务。
(6) 遗传咨询和检测在出生缺陷遗传学研究成果临床转化中发挥核心作用。对子代的遗传物质进行评估并判断其致病性,能够在婚前筛查、辅助生殖以及产前诊断等环节中及早发现潜在患儿。临床上若能借助遗传咨询发挥“桥梁”作用,将现代医学遗传知识有效地传递给普通民众,促成理性的互动,帮助育龄夫妻或患儿父母做出合理选择,则能够有效降低实际出生缺陷率,提高我国人口健康水平。作为一门新兴学科,我国遗传咨询体系尚不成熟,亟待完善。2015年2月9日中国遗传学会遗传咨询分会在上海正式成立,贺林任主任委员。此后中国遗传学会遗传咨询分会在贺林院士的领导下(图3)开始陆续在全国各主要城市开办遗传咨询师培训班,目前已开办13期初级班,3期中级班[60]和1期高级班,总共培训相关人员近4000人,有效地促进了我国遗传咨询和基因检测的健康发展。不过目前许多医疗机构包括第三方遗传检测机构仍存在较为严重的过度诊断或诊断不足等无序状况,因此除了建设相关人才队伍还需要制定相应的行业规范或指南。2016年10月,国家卫生和计划生育委员会发布了《规范有序开展孕妇外周血胎儿游离DNA产前筛查与诊断工作的通知》;2017年2月,中国遗传学会遗传咨询分会联合多位遗传咨询专家形成了《中国遗传咨询标准专家共识指南》和《遗传变异分类标准与指南》[61]。这些文件都为临床遗传咨询工作起到了及时而有效的指导。2017年6月,上海市妇幼保健中心正式挂牌成立“上海市‘健康孩’协同创新中心”,旨在联合贺林院士团队,以开展遗传咨询、遗传检测、加强三级预防管理为抓手,全方位整链条地打造出生缺陷防控示范服务体系,尤其是遗传咨询服务的示范和出生缺陷检测技术的引领,以期在机构层面带动出生缺陷防控事业的有序发展。在临床新技术方面,当前的无创产前筛查(non-invasive prenatal screening, NIPS)还只能检出明显的染色体变异,未来可进一步拓展到对单基因疾病的无创性检出(如利用胎儿有核红细胞)。此外还有染色体芯片(chromosomal microarray, CMA)在产前诊断中的普及应用[62]。CMA在CNV和SNP类型的突变检出中具有明显的优势[63]。在遗传咨询的临床实践中,临床专家还发现目前检测中会出现大量无法进行临床注释的突变(variants of unknown significance, VUS),这些突变为致病性的理论概率低至10%,也可以高至90%,存在较大的不确定性,未来如果能够建立起大规模的中国人群遗传参考数据库(类似千人基因组计划,可以同时包含正常人群以及疾病人群),这一类型的突变可以得到更好的解释和判断。

Fig. 3Chinese Board of Genetic Counseling was founded in Shanghai on Feb 9, 2015 (Professor Lin He was elected as the chairman of the board)
(7) 基因治疗技术的发展。出生缺陷遗传学的研究对主要病因的揭示可以指导临床上的靶向基因治疗。脊髓性肌萎缩症(spinal muscular atrophy, SMA)是一种严重的出生缺陷疾病,其中I型的患儿活不过2岁,SMN基因的失活是其首要病因,一直以来被认为无药可医。2017年,New England Journal of Medicine杂志报道了美国一项针对I型SMA患儿的临床I期实验,实验采用腺相关病毒(adeno-associated viruses, AAV)载体向大脑细胞传递正常的SMN基因,结果发现参与这项临床试验的15名患儿全部都活过了两岁,而正常情况下能活到20个月的SMA患儿只有8%[64]。目前,我国将最新的CRISPR技术应用于临床基因治疗方面走在世界前列[65]。遗传病因的准确发现配合日益成熟的基因治疗技术,将为成千上万的出生缺陷患儿带来福音[66]。基因治疗还可以应用在胚胎阶段,即在患儿出生前就纠正其致病突变,从而避免可预测的出生缺陷的发生[67]。中山大学生命科学学院黄军就团队分别于2015年[68]和2017年[69]在Protein & Cell杂志上报道了对人类胚胎进行精准基因修复的工作,引起世界范围内的广泛关注和伦理学的探讨。目前普遍认为,以消除疾病为目的的胚胎基因编辑研究及治疗性应用是值得鼓励的[70]。
Abstract After almost 30 years of promise tempered by setbacks, gene therapies are rapidly becoming a critical component of the therapeutic armamentarium for a variety of inherited and acquired human diseases. Gene therapies for inherited immune disorders, hemophilia, eye and neurodegenerative disorders, and lymphoid cancers recently progressed to approved drug status in the United States and Europe, or are anticipated to receive approval in the near future. In this Review, we discuss milestones in the development of gene therapies, focusing on direct in vivo administration of viral vectors and adoptive transfer of genetically engineered T cells or hematopoietic stem cells. We also discuss emerging genome editing technologies that should further advance the scope and efficacy of gene therapy approaches.