A teaching design to introduce chromosomal aberration in genetics using case studies of chimeric genes
Lei Ma, Tingting Zhang
编委: 史庆华
基金资助:
Fund supported:
作者简介 About authors

马磊, 张婷婷. 应用嵌合基因实例拓展遗传学染色体畸变的教学[J]. 遗传, 2018, 40(12): 1129-1135 doi:10.16288/j.yczz.18-158
Lei Ma, Tingting Zhang.
染色体相互易位,能导致位于不同染色体,或同一染色体不同区域的基因发生融合,产生嵌合基因(chimeric gene)[6,7]。嵌合基因可连接不同来源基因的功能域,组合出新功能,改变原有分子特性,引起功能失常[8],可能是致使固有平衡系统紊乱的原因之一。然而,因学时数、通识性和书籍容量等因素,鲜见在课堂或教科书中讲述与嵌合基因相关的内容,制约了学生对染色体结构变异的深度探究。为了满足学生的探索欲,本团队结合近年对嵌合基因的研究经验及遗传学教学实践,选取了一些嵌合基因实例,设计了相应教学环节,予以拓展染色体畸变的教学,以期在染色体结构变异教学过程中,使学生对基因的变异及功能有更深入的理解,为遗传学教学提供参考。
1 以一个司法案例创设情境,提升教与学的趣味性
美国一对父母曾将一个产前遗传诊断公司告上法庭,起诉理由是因该公司疏忽大意,导致原告竭力避免的遗传缺陷不幸地出现在了他们的新生儿体中。最终,相关公司被判赔偿原告及新生儿上千万美元。事情的经过大致如下:Hook (化名)的表妹患有严重癫痫病,基因检测诊断出患有22号和9号染色体非平衡易位。知情后,Hook也做了检测,未见异常,但有平衡染色体易位的问题。Hook夫妇第一胎生育正常,但随后多次怀孕,每次孕检胎儿均有染色体易位问题,只能流产。直到这一次,检验公司告之一切正常,结果却产下了一个患有染色体出生缺陷的新生儿。因此,该父母将检验公司告上法庭。引发不幸的原因,是BCR-ABL1嵌合基因的功能异常所致[9]。人类的22号染色体长臂区段易位至9号染色体长臂上,形成了一个较小的新22号染色体。此染色体因首先在美国费城一例慢性粒细胞白血病患者中发现,而被命名为费城染色体。易位致使22号染色体的断裂点簇区域(breakpoint cluster region, BCR)和9号染色体的ABL1融合,形成嵌合基因。正常的ABL1蛋白的酪氨酸激酶的活性受严格调控,而BCR-ABL1却有连续的、自发的和显著增强的酪氨酸激酶活性。90%的慢性粒细胞白血病由BCR-ABL1酪氨酸激酶的异常活性引起。
2 引入嵌合基因,补充理论知识
嵌合基因可转录为嵌合mRNA,翻译成嵌合蛋白。融合前的原基因一般称为亲本基因。嵌合蛋白通过连接不同基因的功能域,可改变亲本基因的功能,增加转录组和蛋白质组的多样性和复杂性,甚至阻碍正常的信号通路,起始或激活癌细胞生长。例如,多数前列腺癌携带的嵌合基因TMPRSS2- ERG,由TMPRSS2启动子与ERG的编码区融合而成,会驱动一种独特的转录程序,诱导DNA损伤、癌细胞侵袭和转移[10]。亲本基因可位于不同染色体上,也可位于同一染色体的不同DNA链上,亦可在同一条DNA链上,但嵌合基因与亲本基因的外显子排列顺序不同。嵌合基因概念的提出对传统经典基因定义提出了疑问和挑战,一个基因是否仅对应于染色体上的某一特定区段,而非来源于染色体不同的区段[7]?
3 分析嵌合基因实例,延伸学习兴趣
基因融合所导致的功能异常,是嵌合基因致癌的潜在机制之一,常表现为激酶活性异常、细胞定位异常和靶基因互作异常等。下面以BCR-ABL1、PAX5-JAK2和RUNX1-ETO为例,说明嵌合蛋白的功能异常特点;此外,引入嵌合基因相关数据库,扩充和延伸知识点。3.1 BCR-ABL1与激酶活性异常有关
前面提及的费城染色体,即是染色体交互易位产生嵌合癌基因的例子。那么,为什么BCR-ABL1嵌合基因会致癌呢?在正常细胞内,ABL1所编码蛋白N端含有一个抑制激酶活性的区域,激酶活性受控。然而,BCR与ABL1融合后(图1 A),ABL1的激酶抑制区失活,分子构象改变,激酶活性异常增高,活化了许多调控细胞周期的蛋白和酶,细胞分裂加速,进而致癌。图1

A:BCR-ABL1 蛋白结构域。B:PAX-JAK2蛋白结构域。C:RUNX1-ETO 蛋白结构域及与其互作靶基因(修改自文献[17]),互作基因标注于相应的结构域下方。D:染色体易位断点的分布及染色体间易位的丰度,自外而内显示:(1)染色体号、坐标和染色体区段;(2)相邻的易位断点的最小距离(log10转换);(3)易位断点在染色体上的分布密度;(4)以连线示意染色体间的易位情况,连线的颜色示意某一位点的易位发生数量。所有圈横坐标为染色体坐标。E:嵌合基因的结构域组合形式(修改自文献[8]),直线为非编码区(UTR),方框为编码区(CDS),绿色和红色分别示意5°上游和3°下游亲本的序列,黄色方框为移码框突变形成的新编码区,SP:信号肽序列。
Fig. 1Chimeric protein domains and chromosome translocation distribution
3.2 PAX5-JAK2与细胞定位异常有关
PAX5位于人类9号染色体的负链,具有保守的结合DNA的结构域,是一种调控B细胞早期发育的转录因子;JAK2位于9号染色体正链,具有酪氨酸激酶结构域,可调控许多细胞因子的信号转导(图1 B)[16]。二者嵌合之前受严格调控,蛋白质分别定位于细胞核和细胞质,而嵌合后PAX5-JAK2却兼备了DNA结合域和酪氨酸激酶活性,成为了一种细胞核内的活性激酶,致使原PAX5和JAK2的部分靶基因的表达和下游信号通路受干扰,从而诱导B细胞的肿瘤性转化[16]。3.3 RUNX1-ETO竞争结合底物
嵌合蛋白可与亲本蛋白竞争底物,从而引发功能紊乱致癌。例如,在急性髓系白血病中发现的RUNX1-ETO融合蛋白[17,18]。RUNX1是造血干细胞分化的关键转录因子,其上含有结合DNA的Runt同源结构域。ETO是转录阻遏因子。RUNX1-ETO嵌合蛋白,保留了RUNX1的DNA结合域,继承了其结合靶基因启动子调控区的能力;然而,同时含有转录阻遏因子ETO的大部分结构域(图1 C)。该嵌合蛋白会与亲本基因竞争性结合靶基因,抑制转录、干扰正常功能、阻断分化进而引发白血病[17]。3.4 引入嵌合基因数据库,提高科研检索乐趣
随着DNA测序技术的进步和人类基因组的研究深入,越来越多的嵌合基因被鉴定出来,相关结果汇集于公共数据库中。Chimer DB (是一个关于人类基因组染色体重排和嵌合基因的数据库,收集了大量嵌合转录本,包含染色体间易位、缺失、重复和倒位等结构变异数据,是确定癌症标志物和药物靶点的一个有价值的工具[19]。
ProteinPaint (https://pecan.stjude.org/)是St. Jude儿童研究医院开发的一个研究基因变异的强大交互式工具[20]。在ProteinPaint的交互式信息图中,可显示基因上的突变,涵盖癌症亚型、突变类型、突变频率和突变位置等一系列信息。这些信息可以用于探究突变在癌症发生、发展和复发中的潜在机制。
ChiTaRS (http://chitars.bioinfo.cnio.es)数据收录了人类、小鼠、果蝇、斑马鱼、奶牛、大鼠、猪和酵母的嵌合转录本,以及人类致癌的染色体断点数据[22]。
dbCRID (http://dbCRID.biolead.org)是一个存储人类染色体重排数据的库,包括了大量染色体重排数据,以及所致的疾病及临床征兆等数据,并介绍了重排染色体的断点、基因的位置、连接序列等[23]。
4 融汇嵌合基因的共性,贯通知识点
尽管嵌合基因的实例较多,稍显庞杂,但亦有规律可循。为了深入了解嵌合基因的结构域特征,本文作者曾对人和猪的嵌合RNA及亲本基因[6,7,8]进行了结构域和组合模式的分析,下面将从染色体断点特征、嵌合基因的翻译、细胞定位和转录调控等方面,总结嵌合基因的通性,以提升学生的对知识的融汇贯通能力和培养学生的思维梳理能力。4.1 染色体断点具有非随机性和复发性的特点
在癌症中,产生嵌合基因的染色体断点位置,具有非随机性和复发性的特点,易受染色体的空间位置和DNA序列特征的影响,如碱基序列的重复、脆性位点和酶识别位点等[8,24]。为总结染色体易位的特性,本文作者利用Chimer DB[19]数据库中与人类嵌合基因相关的染色体易位数据(含46 492个嵌合基因),分析了染色体易位的分布和丰度(图1 D)。易位断点在染色体上分布不均匀,断点趋向聚集。例如,在图1 D第二圈(自外向内)的散点图中,横坐标为染色体坐标,纵坐标为邻近断点之间的最小距离,越向内圈距离越小。图中,散点示意染色体的易位断点。整体上散点位于内圈的底端,说明断点之间的距离较近,倾向聚集分布。第三圈的密度图也证实了这一点,显示在一些染色体区段上,断点的发生频率较高,说明复发性较高。
染色体之间相互易位的频率也不同。例如,在图1 D最内圈,用线条显示了不同染色体之间或不同区域之间的易位情况,线的颜色代表了易位发生的频率,低发频率的易位偏多,高发频率的易位偏少。整体上易位呈现非随机性和复发性。
4.2 嵌合基因的翻译特点
一些嵌合基因会保留亲本基因的阅读框(reading frame)[25],编码原亲本的结构域或新蛋白[26]。本文作者分析人和猪嵌合转录本时[7,8],发现亲本基因融合之后,在嵌合分子中会出现以下情况(图1 E): (1)上游亲本基因不编码,仅下游亲本基因编码蛋白,形成5° UTR–CDS形式;(2)上游编码,下游不编码,形成CDS–3° UTR;(3)二者都编码,形成CDS–CDS形式;(4)嵌合基因的阅读框与亲本基因的阅读框错位,编码新蛋白。4.3 嵌合基因的细胞定位
嵌合基因的结构域,可在两亲本结构域的基础上,形成新的结构域组合,甚至是新的结构域,增加转录组和蛋白质组的多样性。下面以信号肽和跨膜结构域为例,说明结构域组合对嵌合蛋白的细胞定位的影响。4.3.1 信号肽对嵌合蛋白细胞定位的影响
信号肽是在起始密码子后一段疏水性肽段,可引导新合成的蛋白质向分泌通路转移,将其定位到细胞不同膜结构内。嵌合基因的细胞定位,可因所融合的信号肽而改变(图1 E):(1)在嵌合分子中,上游亲本的信号肽,会改变下游亲本蛋白的细胞定位;(2)嵌合分子融合后,下游亲本的信号肽位于编码区中部,可能会失去分子引导功能,而改变细胞的定位;(3)原一对亲本基因都没有信号肽,而嵌合蛋白却含信号肽,可能来自移码突变。此外,可能会因移码框突变,或者原亲本基因成为非编码序列,嵌合分子失去原亲本基因的信号肽,而改变定位。
4.3.2 跨膜结构域对嵌合蛋白细胞定位的影响
4.4 嵌合蛋白的表达调控
4.4.1 嵌合蛋白与亲本蛋白的竞争嵌合转录的产物可与亲本蛋白竞争底物,对抗正常蛋白,从而在癌细胞中出现显著负效应。当融合涉及转录激活因子或抑制因子时,与亲本蛋白的竞争倾向性更强,如前述RUNX1-ETO融合蛋白 (图 1 C)。
4.4.2 亲本基因对融合蛋白表达调控的影响
4.4.3 正常组织中融合蛋白的表达调控
5 教学拓展的延伸
