Transcriptome heterogeneity of porcine ear fibroblast and its potential influence on embryo development in nuclear transplantation
Jun Zhou1, Chengcheng Zhao1, Xiao Wu1, Junsong Shi2, Rong Zhou2, Zhenfang Wu1, Zicong Li
通讯作者: 李紫聪,教授,博士生导师,研究方向:动物遗传育种与繁殖。E-mail:lizicongcong@163.com
责任编辑: 赵要风
基金资助: |
Fund supported: |
作者简介 About authors

同一来源的供体细胞之间存在异质性。许多研究已经表明体细胞核移植(somatic cell nuclear transfer, SCNT)效率与供体细胞有关。然而,鲜有在单细胞水平分析供体细胞异质性对核移植效率的潜在影响。本研究利用单细胞转录组测序技术对同一来源且随机挑选的52个猪耳组织成纤维细胞进行测序分析。结果表明有48个单细胞的基因表达模式相似,4个单细胞(编号为D11_1、D12_1、DW61_2和DW99_2)的基因表达模式与其他单细胞存在较大的差异,并且不存在基因表达模式完全相同的两个单细胞。以基因表达模式相似的48个单细胞作为对照,进一步分析了单细胞D11_1、D12_1、DW61_2和DW99_2的差异基因表达模式:首先利用R语言筛选4个单细胞的差异表达基因,并对前50差异表达基因进行汇总;然后对差异表达基因进行GO富集分析和KEGG通路分析。富集分析发现差异表达基因的主要分子功能包括能量代谢、蛋白质代谢和细胞对刺激的反应等;主要通路包括KEGG中富集的与细胞周期、细胞代谢、DNA复制相关的通路。根据以上研究结果并结合SCNT研究进展讨论了4个单细胞的差异基因表达模式对核移植胚胎发育效率的潜在影响。本研究揭示了猪耳组织成纤维细胞的转录组异质性,并提供了分析精英供体细胞的一种有效方法,为提高克隆效率带来新的思路。
There is heterogeneity among donor cells of the same source. Many studies have shown that donor cell affects the efficiency of somatic cell nuclear transfer (SCNT). However, the potential influence of donor cell heterogeneity on the efficiency of nuclear transplantation were rarely analyzed at the single-cell level. In this study, single-cell transcriptome sequencing was performed on 52 porcine ear fibroblasts randomly selected from the same source to compare their gene expression patterns. The results showed that 48 cells had similar gene expression patterns, whereas 4 cells (D11_1, D12_1, DW61_2, DW99_2) had significantly different gene expression patterns from those of other cells. There were no two cells with identical gene expression patterns. The gene expression patterns of D11_1, D12_1, DW61_2 and DW99_2 were analyzed, using the 48 cells with similar gene expression patterns as controls. Firstly, we used the R language statistics to select the differentially expressed genes in the 4 single cells, and identified the top 50 most significant differentially expressed genes. Then GO enrichment analysis and KEGG pathway analysis were performed on the differentially expressed genes. Enrichment analysis revealed that the main molecular functions of the differentially expressed genes included energy metabolism, protein metabolism and cell response to stimulation. The main pathways from KEGG enrichment were related to cell cycle, cell metabolism, and DNA replication. Finally, based on the above results and in consideration with the SCNT research progress, we discussed the potential effects of differential gene expression patterns of the 4 single cells on the embryonic development efficiency of nuclear transplantation. This study revealed transcriptional heterogeneity of porcine ear tissue fibroblasts and provided an effective method to analyze elite donor cells, thereby providing new ideas on improving the cloning efficiency of SCNT.
周俊, 赵成成, 吴霄, 石俊松, 周荣, 吴珍芳, 李紫聪. 猪耳成纤维细胞转录组异质性及对核移植胚胎发育的潜在影响. 遗传[J], 2020, 42(9): 898-915 doi:10.16288/j.yczz.20-190
Jun Zhou.
体细胞核移植技术(somatic cell nuclear transfer, SCNT)又称为体细胞克隆技术。1997年,英国胚胎学家Wilmut利用SCNT技术成功克隆出第一只哺乳动物—克隆羊“多莉”[1],随后,通过该技术先后诞生了牛(Bos taurus)[2]、猪(Sus scrofa)[3]、猴(Macaca mulatta)[4]等20余种哺乳动物。SCNT技术在保护濒危物种[5]、优秀种繁扩繁[6]以及再生医学[7]等领域表现出巨大的应用价值,是生命科学研究的重要成果。但是,SCNT技术同样面临很多问题:以猪为例,体外培养条件下,囊胚率仅为20%左右,在不同品种或者卵母细胞质量差的情况下可能更低。即便胚胎成功附植,相较于体外受精(in vitro fertilization, IVF)胚胎,SCNT胚胎发育能力差、在受孕母猪体内发育异常的现象也十分普遍[8]。除此之外,大多数实验条件下,克隆猪的出生率只有1%左右,远低于人工授精(artificial insemination, AI)猪的出生效率(80%)[9],严重限制了SCNT技术的应用和普及。SCNT技术基础是将供体细胞移入去核的成熟卵母细胞中,最终发育成和供体细胞基因型相同的后代。因此供体细胞是影响体细胞核移植效率的关键因素。已有研究表明供体细胞会对SCNT效率产生影响:供体细胞的细胞周期[10]、传代数[11]以及性别[12]的不同都会导致克隆胚胎发育效率出现差异。因此,选择合适的供体细胞对提高SCNT胚胎发育效率十分重要。
供体细胞核在成熟的去核卵母细胞中异常的表观遗传重编程被认为是阻碍SCNT发育的主要原因[13,14]。而更容易被正确重编程的核供体细胞很可能是具有更大发育潜力的精英供体细胞。Zhai等[15]分别以猪骨髓间充质干细胞和猪胎儿成纤维细胞作为供体细胞进行核移植实验,发现发育效率较高的骨髓间充质干细胞含有更多的有利于重编程的表观遗传标记和较少的抑制重编程的表观遗传标记,暗示容易被正确重编程的供体细胞在SCNT过程中会有更好的发育潜能。同时,Yamanaka等[16]在鼠源诱导多能干细胞研究中就已经提出精英供体细胞的概念:同一来源的细胞中会存在一些更容易被正确重编程、发育潜力更大的精英供体细胞;同样,在克隆小鼠(Mus musculus)的研究中也发现,与其他品系的小鼠相比,129小鼠的基因组状态更不稳定,更容易被激活或抑制。用野生基因型和129小鼠基因型杂交得到的重组细胞做供体,可显著提高克隆动物的出生率[17],说明精英供体细胞具有独特的基因表达模式,只是其分子特征尚未探索清楚。另有研究显示,从供体细胞遗传而来的一些转录记忆可以导致克隆胚胎的发育缺陷[18],表明供体细胞在一定程度上决定了重构胚胎的发育命运。供体细胞的异质性是指供体细胞在基因组或表型水平上具有的不同特征。同时,因为细胞之间异质性的存在,不同的供体细胞发育潜力是有差异的。即便同一来源的供体细胞也存在更有利于胚胎发育的精英供体细胞。但是在实际研究中,同一来源的供体细胞之间表型特征差异不明显,分子层面的特征信息丢失严重,缺乏对常见供体细胞异质性的深入研究。
1 材料与方法
1.1 材料
杜洛克公猪(373日龄)耳组织样品由广东温氏食品集团华农温氏股份有限公司提供;总RNA提取试剂盒SMART-SeqTM v4 UltraTM Low Input RNA Kit for Sequencing购于北京诺禾致源生物信息科技有限公司;胎牛血清(fetal bovine serum, FBS)、氨基酸葡萄糖培养基(dulbecco's modified eagle medium, DMEM)、0.25%胰蛋白酶和乙二胺四乙酸均购自美国Gibco公司。单细胞转录组测序由北京诺禾致源生物信息科技有限公司在illumina平台完成。图片处理使用Photoshop 7.0/ACDSee 9.0软件;spliced reads比对使用HISAT软件[22];聚类分析、基因差异表达分析、GO富集分析和主成分分析(principal component analysis, PCA)均采用R语言,其中聚类分析使用软件包pheatmap,基因差异表达分析使用软件包DEGSeq (1.12.0)[23],富集分析采用软件包GOseq[24];KEGG富集使用软件KOBAS (2.0)。1.2 供体细胞单细胞培养与分离
将成年优良杜洛克种公猪的耳组织样品剪碎,用PBS洗涤两次之后,在100 mm的培养皿上用手术刀和剪子切碎,先用DMEM重悬,再用胰蛋白酶和乙二胺四乙酸消化1~2 h。将胰蛋白酶消化的细胞洗涤一次后,以300 g的离心率离心10 min,并将其接种于100 mm的细胞培养皿中,放入15% FBS和10 mg/L的青霉素-链霉素溶液的DMEM。在39℃、5%CO2饱和湿度的恒温培养箱中培养6~8 d。然后移除未附着的组织块,再将附着的细胞培养直至汇合,期间每隔3~7 d更换DMEM。最后利用显微操作法,在体视显微镜下吸取单个细胞,放于盛有裂解液的去DNase-RNase的离心管中,用于单细胞转录组测序。1.3 单细胞转录组数据获得
1.3.1 总RNA提取每个细胞样品保存在6 μL SMART-SeqTM v4 kit裂解液(北京诺禾致源生物信息科技有限公司)中。细胞样品经过体积测量后,使用SMART-SeqTM v4 UltraTM Low Input RNA Kit for Sequencing试剂盒(美国Clontech公司)进行细胞裂解,提取总RNA,并保存在RNase-Free水中。
1.3.2 单细胞cDNA文库构建及测序
对提取的总RNA直接进行First-stand cDNA的合成,然后对First-stand cDNA进行全长LD-PCR的扩增,利用AMPure XP beads纯化扩增后的双链cDNA (double-standed DNA, ds cDNA),使用Qubit进行ds cDNA定量检测;使用Covaris系统对ds cDNA进行超声打断,打断后的双链短片段进行末端修复、加A尾并连接测序接头,然后用AMPure XP beads纯化并选择片段大小在200 bp左右的文库;最后进行PCR富集得到最终的cDNA文库。使用Qubit2.0对文库进行初步定量,稀释文库至1 ng/μL,使用Agilent 2100对文库的插入片段长度进行检测。插入片段符合预期后,使用qPCR方法对文库的有效浓度进行准确定量,以保证文库质量。库检合格后,将不同文库按照有效浓度及目标下机数据量的需求合并后进行HiSeq测序。本研究最后扩增成功且完成单细胞测序的样品为52个,细胞样品编号见表1。
Table 1
Table 1
序号 | 样品编号 | 序号 | 样品编号 | 序号 | 样品编号 |
1 | D1_1 | 19 | D31_1 | 37 | DW22_2 |
2 | D1_3 | 20 | D32_3 | 38 | DW24_1 |
3 | D8_2 | 21 | D33_1 | 39 | DW31_1 |
4 | D9_2 | 22 | D36_3 | 40 | DW36_1 |
5 | D11_1 | 23 | D37_3 | 41 | DW36_2 |
6 | D12_1 | 24 | D40_2 | 42 | DW41_2 |
7 | D12_2 | 25 | D40_3 | 43 | DW45_1 |
8 | D13_1 | 26 | D43_3 | 44 | DW45_2 |
9 | D18_3 | 27 | D44_1 | 45 | DW58_2 |
10 | D20_1 | 28 | D45_3 | 46 | DW61_1 |
11 | D21_1 | 29 | D48_1 | 47 | DW61_2 |
12 | D22_1 | 30 | D52_3 | 48 | DW69_1 |
13 | D23_3 | 31 | D63_1 | 49 | DW69_2 |
14 | D25_1 | 32 | D63_2 | 50 | DW73-1 |
15 | D26_1 | 33 | D64_1 | 51 | DW99_1 |
16 | D27_1 | 34 | D66_1 | 52 | DW99_2 |
17 | D28_1 | 35 | DW16_1 | ||
18 | D28_2 | 36 | DW22_1 |
1.4 单细胞转录组数据分析
1.4.1 测序数据质量控制fastq格式的原始数据先通过内部perl脚本进行处理。在此步骤中,删除包含适配器的reads、包含ploy-N的低质量的原始数据来获得干净的数据(clean reads),同时对Q20、Q30和GC内容进行计算,所有的下游分析都是基于高质量的清洁数据。1.4.2 差异基因表达分析参考基因组和基因模型注释文件直接从基因组网(http://www.ensembl.org/)下载。选取HISAT软件将过滤后的测序序列进行基因组定位分析。HISAT能够有效的比对到RNA-Seq测序数据中的spliced reads,是目前比对率最高且最准确的比对软件。先使用Hisat2 v2.0.4作为映射工具,它可以基于基因模型注释文件生成一个拼接连接的数据库,因此比其他非拼接映射工具具有更好的映射结果。然后使用软件HTSeq v0.9.1计算映射到每个基因的读取数字。然后根据基因的长度计算出每个基因的FPKM,并读取到该基因的计数。在进行差异基因表达分析之前,通过edgeR程序包[25]对每一个序列库标准化。利用R语言中的DEGSeq (1.20.0)软件包进行微分表达式分析并绘制4个“另类”细胞差异基因火山图、聚类软件包pheatmap绘制4个“另类”细胞差异基因聚类图。P值用Benjamini 和 Hochberg法进行调整,修正的P值为0.005和log2(fold change)为1,为显著差异表达的阈值。1.4.3 GO富集分析和KEGG通路分析通过R语言中的GOseq软件包对筛选得到的差异基因进行GO富集,展示差异基因在Gene Ontology (2 结果与分析
2.1 单细胞转录组测序揭示猪耳组织成纤维细胞间的异质性

Fig. 1Principal component analysis of 52 single cell transcriptomes

Fig. 2Heat map of 52 single cell transcriptomes
2.2 D11_1、D12_1、DW61_2和DW99_2基因表达模式分析
将基因表达模式差异不明显的“普通”细胞作为对照组,使用R语言中的软件包DEGSeq (1.12.0)对D11_1、D12_1、DW61_2和DW99_2进行差异基因表达分析。D11_1与对照组比较,有1860个差异表达显著的基因,其中上调表达的基因有458个,下调表达的基因有1402个;D12_1与对照组比较, 有376个差异表达显著的基因,其中上调表达的基因有109个,下调表达的基因有267个;DW61_2与对照组比较,有330个差异表达显著的基因,其中上调表达的基因有277个,下调表达的基因有53个;DW99_2与对照组比较,有2225个差异表达显著的基因,其中上调表达的基因有316个,下调表达的基因有1909个。使用R语言中软件包DEGSeq (1.12.0)将4个“另类”细胞的差异基因的整体分布情况可视化(图3),使用R语言中的聚类软件包pheatmap将4个“另类”细胞的差异基因整体表达情况可视化(图4)。同时,将用软件包DEGSeq (1.12.0)筛选出的D11_1、D12_1、DW61_1和DW99_2前50个差异最显著的基因进行汇总:D11_1前50个差异最显著的基因功能主要集中于细胞增殖分化过程中一些有机物质的合成与能量代谢过程(表2);D12_1前50个差异最显著的基因功能主要集中于蛋白质及葡萄糖转运等过程(表3);DW61_2前50个差异最显著的基因功能比较多样,但有个别基因涉及转移酶活性(表4);DW99_2前50个差异最显著的基因功能主要集中于蛋白质编码、核酸修复与能量代谢方面(表5)。图3

A~D分别为D11_1、D12_1、DW61_2和DW99_2的差异基因火山图;有显著性差异表达的基因用红色点(上调)和绿色点(下调)表示,无显著性差异表达的基因用蓝色点表示;横坐标代表基因在不同样本中表达倍数变化;纵坐标代表基因表达量变化差异的统计学显著性;筛选标准padj < 0.05。
Fig. 3D11_1, D12_1, DW61_2 andDW99_2 differential genes expression volcano map

整体FPKM层次聚类图,将log10(FPKM+1)值进行归一化转换(scale number)并进行聚类,红色表示高表达基因,蓝色表示低表达基因。颜色从红到蓝,表示log10(FPKM+1)从大到小。
Fig. 4D11_1, D12_1, DW61_2 and DW99_2 differential gene clustering heat map
Table 2
Table 2
基因 | 基因全称 | 表达情况 |
TMEM198 | Transmembrane protein 198 | ↑ |
ALDOB | Aldolase, fructose-bisphosphate B | ↑ |
UMOD | Uromodulin | ↑ |
ASS1 | Argininosuccinate synthase 1 | ↑ |
SLC5A12 | Solute carrier family 5 member 12 | ↑ |
SLC34A1 | Sus scrofa solute carrier family 34 member 1 (SLC34A1), mRNA | ↑ |
AGR2 | Anterior gradient protein 2 homolog precursor | ↑ |
U6 | U6 spliceosomal RNA | ↑ |
BHMT | Betaine-homocysteine S-methyltransferase 1 | ↑ |
DDC | Dopa decarboxylase | ↑ |
DAO | D-amino-acid oxidase | ↑ |
SLC13A3 | Solute carrier family 13 member 3 | ↑ |
CDH16 | Cadherin 16 | ↑ |
CYP2D25 | Vitamin D(3) 25-hydroxylase | ↑ |
PPARGC1B | PPARG coactivator 1 beta | ↑ |
FBP1 | Fructose-1,6-bisphosphatase 1 | ↑ |
G6PC | Glucose-6-phosphatase | ↑ |
CLDN2 | Claudin-2 | ↑ |
DMGDH | Dimethylglycine dehydrogenase | ↑ |
FMO1 | Dimethylaniline monooxygenase [N-oxide-forming] 1 | ↑ |
UPP2 | Uridine phosphorylase 2 | ↑ |
CYP4A24 | Sus scrofa cytochrome P450,family 4,subfamily A,polypeptide 21 (CYP4A21), mRNA | ↑ |
HNF4A | Hepatocyte nuclear factor 4-alpha | ↑ |
ADSL | Adenylosuccinate lyase | ↓ |
IGFBP6 | Insulin-like growth factor-binding protein 6 precursor | ↓ |
ORMDL2 | ORMDL sphingolipid biosynthesis regulator 2 | ↓ |
MRPS35 | Mitochondrial ribosomal protein S35 | ↓ |
TM7SF3 | Transmembrane 7 superfamily member 3 | ↓ |
DERA | Deoxyribose-phosphate aldolase | ↓ |
LTBR | Tumor necrosis factor receptor superfamily member 3 precursor | ↓ |
TULP3 | Tubby like protein 3 | ↓ |
PPHLN1 | Periphilin 1 | ↓ |
PUS7L | Pseudouridylate synthase 7 like | ↓ |
SLC38A1 | Solute carrier family 38 member 1 | ↓ |
NEDD1 | Neural precursor cell expressed, developmentally down-regulated 1 | ↓ |
SELENOO | Sus scrofa selenoprotein O (SELENOO), mRNA | ↓ |
SLC35B3 | Solute carrier family 35 member B3 | ↓ |
FAM8A1 | Family with sequence similarity 8 member A1 | ↓ |
MBOAT1 | Membrane bound O-acyltransferase domain containing 1 | ↓ |
novel gene | Lysosomal thioesterase PPT2 precursor | ↓ |
MAN2A2 | Mannosidase alpha class 2A member 2 | ↓ |
HMG20A | High mobility group 20A | ↓ |
CSPG4 | Chondroitin sulfate proteoglycan 4 | ↓ |
SRP54 | Signal recognition particle 54 | ↓ |
FOS | Proto-oncogene c-Fos | ↓ |
SPTLC2 | Serine palmitoyltransferase long chain base subunit 2 | ↓ |
ATXN3 | Ataxin-3 | ↓ |
2.3 D11_1、D12_1、DW61_2和DW99_2差异基因GO富集分析和KEGG通路分析
对D11_1、D12_1、DW61_2和DW99_2测序得到的差异基因进行GO富集分析,这些差异基因在生物过程、细胞组分和分子功能方面的分布情况见图5。D11_1上调的差异表达基因主要集中于与细胞代谢有关的线粒体等细胞器和细胞器膜,下调的差异表达基因主要涉及与细胞代谢有关的蛋白代谢和物质运输生物过程。D12_1上调的差异表达基因无显著富集,而下调的差异表达基因主要富集于细胞对刺激的反应与蛋白代谢的细胞过程与应对刺激信号传导的膜的变化。DW61_2上调和下调的差异表达基因均无显著富集。DW99_2上调的差异表达基因主要富集于细胞有丝分裂有关的DNA复制、染色体分离、核酸代谢等生物过程和与之相关的一些胞内有机物质的变化,而下调的差异表达基因则主要涉及蛋白代谢和蛋白修饰等一些高分子修饰过程。结果显示D11_1和DW99_2的差异基因功能富集趋势更为明显,基因表达模式也更为“另类”。Table 3
Table 3
基因 | 基因全称 | 表达情况 |
PARVG | Gamma-parvin | ↑ |
POU3F1 | POU class 3 homeobox 1 | ↑ |
ASS1 | Argininosuccinate synthase 1 | ↑ |
UMOD | Uromodulin | ↑ |
PNMA2 | Paraneoplastic Ma antigen 2 | ↑ |
ADGRG7 | Adhesion G protein-coupled receptor G7 | ↑ |
KRT28 | Keratin 28 | ↑ |
GSDMB | Gasdermin B | ↑ |
U6 | U6 spliceosomal RNA | ↑ |
RNF223 | Ring finger protein 223 | ↑ |
TBX10 | T-box 10 | ↑ |
TMPRSS2 | Transmembrane protease, serine 12 | ↑ |
HTR1E | 5-hydroxytryptamine receptor 1E | ↑ |
HIC2 | HIC ZBTB transcriptional repressor 2 | ↑ |
SLC34A1 | Sus scrofa solute carrier family 34 member 1 (SLC34A1), mRNA. | ↑ |
ALDOB | Aldolase, fructose-bisphosphate B | ↑ |
CSN1S1 | Sus scrofa casein alpha s1 (CSN1S1), mRNA. | ↑ |
SLC2A12 | Solute carrier family 2 member 12 | ↑ |
CD53 | CD53 molecule | ↑ |
NAGA | Alpha-N-acetylgalactosaminidase precursor | ↓ |
ADSL | Adenylosuccinate lyase | ↓ |
C12orf4 | Homolog isoform 2 | ↓ |
SLC35B3 | Solute carrier family 35 member B3 | ↓ |
LEMD2 | LEM domain containing 2 | ↓ |
GOLGA5 | Golgin A5 | ↓ |
GSTA4 | Glutathione S-transferase A4 | ↓ |
FAM98C | Family with sequence similarity 98 member C | ↓ |
LDLRAP1 | Low density lipoprotein receptor adaptor protein 1 | ↓ |
PLK3 | Polo like kinase 3 | ↓ |
SMOC2 | SPARC related modular calcium binding 2 | ↓ |
SPG21 | Sus scrofa spastic paraplegia 21 (autosomal recessive, Mast syndrome) (SPG21), mRNA | ↓ |
PCLAF | Sus scrofa PCNA-associated factor (LOC100514810), mRNA | ↓ |
SERPIN2 | Serpin family B member 2 | ↓ |
AEN | Apoptosis enhancing nuclease | ↓ |
GCNT1 | Glucosaminyl (N-acetyl) transferase 1, core 2 | ↓ |
PPP6C | Serine/threonine-protein phosphatase 6 catalytic subunit | ↓ |
PCSK6 | Proprotein convertase subtilisin/kexin type 6 | ↓ |
BOP1 | Block of proliferation 1 | ↓ |
FAM49B | Protein FAM49B | ↓ |
PLAT | Tissue-type plasminogen activator precursor | ↓ |
SMOX | Spermine oxidase | ↓ |
ASPN | Asporin precursor | ↓ |
IL1R1 | Interleukin 1 receptor type 1 | ↓ |
Table 4
Table 4
基因 | 基因全称 | 表达情况 |
NPPB | Natriuretic peptides B Brain natriuretic peptide 32 Brain natriuretic peptide 26 | ↑ |
GRIK2 | Glutamate ionotropic receptor kainate type subunit 2 | ↑ |
PAX1 | Paired box 1 | ↑ |
DOK5 | Docking protein 5 | ↑ |
ANKR2 | Ankyrin repeat domain 2 | ↑ |
SLC114 | Solute carrier family 16 member 14 | ↑ |
GPR37 | G protein-coupled receptor 37 | ↑ |
TRPV2 | Transient receptor potential cation channel subfamily V member 2 | ↑ |
RHCE | Sus scrofa Rh blood group CcEe antigens (RHCE), mRNA. | ↑ |
MFNG | MFNG O-fucosylpeptide 3-beta-N-acetylglucosaminyltransferase | ↑ |
UBAPL | Ubiquitin associated protein 1 like | ↑ |
ASPG | Asparaginase | ↑ |
CRYBA1 | Crystallin beta A1 | ↑ |
RECQL | ATP-dependent DNA helicase Q1 | ↓ |
RIMKLB | Ribosomal modification protein rimK like family member B | ↓ |
C1R | Complement C1r | ↓ |
WASHC4 | WASH complex subunit 4 | ↓ |
GNPTAB | N-acetylglucosamine-1-phosphate transferase alpha and beta subunits | ↓ |
SELENOO | Sus scrofa selenoprotein O (SELENOO), mRNA. | ↓ |
MAN2A2 | Mannosidase alpha class 2A member 2 | ↓ |
STRA6 | Stimulated by retinoic acid 6 | ↓ |
ISLR | Immunoglobulin superfamily containing leucine rich repeat | ↓ |
HECTD1 | HECT domain E3 ubiquitin protein ligase 1 | ↓ |
C14orf119 | Chromosome 14 open reading frame 119 | ↓ |
NFAT5 | Nuclear factor of activated T-cells 5 | ↓ |
E2F4 | E2F transcription factor 4 | ↓ |
INPP5B | Inositol polyphosphate-5-phosphatase B | ↓ |
SMOC2 | SPARC related modular calcium binding 2 | ↓ |
MTHFD1L | Methylenetetrahydrofolate dehydrogenase (NADP+ dependent) 1 like | ↓ |
LATS1 | Large tumor suppressor kinase 1 | ↓ |
ME2 | Malic enzyme 2 | ↓ |
TRIP4 | Thyroid hormone receptor interactor 4 | ↓ |
LEO1 | LEO1 homolog, Paf1/RNA polymerase II complex component | ↓ |
VPS39 | VPS39, HOPS complex subunit | ↓ |
DPP8 | Dipeptidyl peptidase 8 | ↓ |
HACD3 | 3-hydroxyacyl-CoA dehydratase 3 | ↓ |
PRPF39 | Pre-mRNA processing factor 39 | ↓ |

A~D分别为D11_1、D12_1、DW61_2和DW99_2与对照组差异表达基因的GO富集柱状图。纵坐标为富集的GO term,横坐标为该term中差异基因个数。不同颜色用来区分生物过程、细胞组分和分子功能,带“*”为显著富集的GO term,对富集最显著的30个GO term在图中展示,如果不足30条,则全部展示。
Fig. 5GO enrichment histogram of D11_1, D12_1, DW61_2 and DW99_2 differentially expressed genes
利用KEGG注释系统对D11_1、D12_1、DW61_2和DW99_2进行差异基因代谢通路富集分析。结果显示(图6),D11_1上调的基因主要作用于细胞代谢,而下调的基因主要作用于细胞凋亡;D12_1与DW61_2 KEGG均无显著通路富集;DW99_2 KEGG通路中上调的差异基因最显著的富集于调节DNA复制、细胞周期通路。
Table 5
Table 5
基因 | 基因全称 | 表达情况 |
GBX2 | Gastrulation brain homeobox 2 | ↑ |
PCDH12 | Protocadherin 12 | ↑ |
ARHGEF9 | Cdc42 guanine nucleotide exchange factor 9 | ↑ |
TRAM1L1 | Translocation associated membrane protein 1-like 1 | ↑ |
U6 | U6 spliceosomal RNA | ↑ |
DMTN | Dematin actin binding protein | ↑ |
CEP72 | Centrosomal protein 72 | ↑ |
YBX2 | Y-box binding protein 2 | ↑ |
ZNF768 | Zinc finger protein 768 | ↑ |
NOTCH4 | Neurogenic locus notch homolog protein 4 precursor | ↑ |
GARNL3 | GTPase activating Rap/RanGAP domain like 3 | ↑ |
MTBP | MDM2 binding protein | ↑ |
UHRF1 | Ubiquitin like with PHD and ring finger domains 1 | ↑ |
PACSIN2 | Protein kinase C and casein kinase substrate in neurons 2 | ↑ |
EP300 | E1A binding protein p300 | ↓ |
ADSL | Adenylosuccinate lyase | ↓ |
PWP1 | PWP1 homolog, endonuclein | ↓ |
IGFBP6 | Insulin-like growth factor-binding protein 6 precursor | ↓ |
MMP19 | Matrix metallopeptidase 19 | ↓ |
ESYT1 | Extended synaptotagmin 1 | ↓ |
SMARCC2 | SWI/SNF related, matrix associated, actin dependent regulator of chromatin subfamily c member 2 | ↓ |
PTGES3 | Prostaglandin E synthase 3 | ↓ |
MON2 | MON2 homolog, regulator of endosome-to-Golgi trafficking | ↓ |
XPOT | Exportin for tRNA | ↓ |
TMEM19 | Transmembrane protein 19 | ↓ |
TBC1D15 | TBC1 domain family member 15 | ↓ |
DNM1L | Dynamin 1 like | ↓ |
FAR2 | Fatty acyl-CoA reductase 2 | ↓ |
ARNTL2 | Aryl hydrocarbon receptor nuclear translocator like 2 | ↓ |
TM7SF3 | Transmembrane 7 superfamily member 3 | ↓ |
FGFR1OP2 | FGFR1 oncogene partner 2 | ↓ |
AEBP2 | AE binding protein 2 | ↓ |
LRP6 | LDL receptor related protein 6 | ↓ |
C1R | Complement C1r | ↓ |
NOP2 | Sus scrofa NOP2 nucleolar protein (NOP2), mRNA | ↓ |

A~D分别代表D11_1、D12_1、DW61_2和DW99_2与对照组的差异表达基因KEGG富集散点图。纵轴表示pathway名称,横轴表示Rich factor,点的大小表示此pathway中差异表达基因个数多少,而点的颜色对应于不同的q value范围。
Fig. 6KEGG enrichment scatter plot of D11_1, D12_1, DW61_2 and DW99_2
3 讨论
本研究将精度对准细胞水平,用单细胞转录组数据反映不同供体细胞的基因表达模式:52个成功测序的猪耳成纤维细胞转录组热图反映同一组织供体细胞间的基因表达模式差异;通过对上述52个细胞进行主成分分析,发现 4个基因表达模式明显不同的“另类”细胞,证实了供体细胞间异质性的存在。同时,推测“另类”细胞的基因表达模式和精英供体细胞存在联系。D11_1与“普通”细胞相比,其上调基因GO富集于与细胞代谢相关的细胞器、细胞膜,尤其是线粒体,主要功能为促进细胞代谢。其下调基因在KEGG分析中主要集中在细胞凋亡通路。在正常受精胚胎中,精子来源的mtDNA在受精不久后被全部破坏,其mtRNA全部来源于卵母细胞[35]。但是在SCNT胚胎中却存在供体来源的mtDNA[36]。因此,这些供体来源的线粒体DNA可能是影响克隆效率的关键线索。同时,D11_1差异基因表达结果也暗示了通过研究线粒体相关基因寻找精英供体细胞的可能。在D11_1表达上调的差异基因中,ASS1基因[37,38]可以调节精氨酸合成,而L-精氨酸又是细胞信号传导、代谢功能分子(NO、多胺和肌酸)的主要合成前体[39],对胚胎发育十分重要。UMOD基因的表达能加快蛋白质代谢和高尔基体转运,增加胚胎发育能力[40,41]。在D11_1表达下调的差异基因中,ORM基因家族蛋白负向调节鞘脂代谢[42],其下调表达会促进细胞生长分化;LTBR基因的表达可促进细胞凋亡[43,44],其下调表达起到抑制细胞凋亡的作用;PPHLN1是一种介导表观遗传抑制修饰的多蛋白复合物[45],可以推动细胞重编程障碍H3K9me3[46]的表观抑制修饰,其下调表达有利于克隆胚胎正确重编程。因此,D11_1的基因表达模式可作为精英供体细胞的潜在参考。
