The Screening and Identification of LncRNA Related to Villus Growth in Liaoning Cashmere Goats by MT and FGF5
JIN MEI, ZHANG LIJUAN, CAO QIAN, GUO XinYingLiaoning Normal University School of Life Sciences, Liaoning Provincial Key Laboratory of Biotechnology and Molecular Drug Development, Dalian 116029, Liaoning收稿日期:2018-09-3接受日期:2018-12-3网络出版日期:2019-02-16
基金资助:
作者简介 About authors

金梅, 张丽娟, 曹倩, 郭鑫英. MT和FGF5调控辽宁绒山羊绒毛生长相关LncRNA的筛选及鉴定[J]. 中国农业科学, 2019, 52(4): 738-754 doi:10.3864/j.issn.0578-1752.2019.04.014
0 引言
【研究意义】辽宁绒山羊是中国代表性的绒山羊品种,其体型较大,适应能力强,遗传稳定性好。辽宁绒山羊是绒肉兼用的地方良种,该种绒山羊产绒量高,绒毛品质好,其绒毛是珍贵的纺织原料。因此,研究如何提高辽宁绒山羊羊绒产量及品质尤为重要。【前人研究进展】毛囊是皮肤中的附属结构,可分为初级毛囊和次级毛囊,初级毛囊产毛,次级毛囊产绒[3]。哺乳动物被毛的生长替换是一个复杂的生理过程,被毛的替换与毛囊的周期性生长密切相关,一般一个生长周期内毛囊要经历生长期、退行期和休止期三个阶段[4]。环境、代谢水平和基因调控等因素都可影响绒山羊毛囊的周期性生长过程,有研究表明,很多的信号分子都在毛囊的形态发生过程中具有很重要的作用,褪黑激素(melatonin,MT)、催乳素(prolactin)、成纤维细胞生长因子5(fibroblast growth factor 5, FGF5)、甲状腺素(thyroxine)等 [5,6]。MT是由松果体分泌出来的一种高度保守的吲哚类激素[7]。它在很多细胞、组织和器官中都起到重要作用[8]。IBRAHEEM 等研究发现,催乳素和褪黑激素对次级毛囊的毛干伸长具有刺激作用[9]。LOGAN等发现,褪黑激素能够抑制由α-黑素细胞刺激素(MSH)引起的黑素生成的增加[10]。有****发现,皮肤组织是除松果体外,MT合成与代谢的又一重要的场所[11]。近年来,很多研究表明MT可能在毛发生理学中起重要作用,其受体(MT2和RORα)以毛发周期依赖性方式在小鼠皮肤中表达,抑制角质形成细胞凋亡[12,13]。另外,MT能够改变山羊中羊绒生长周期的时间,外源性的MT能够促进毛囊从休止期向生长初期转变,延长生长初期[14,15]。有****发现,褪黑激素可作为自由基清除剂和DNA修复诱导剂,代谢和增殖活性高的毛发生长初期毛球也可以利用褪黑素合成作为自身细胞保护策略[16]。FGF5是目前所发现的一种与绒毛生长有直接关系的基因之一。最早发现的安哥拉鼠被毛增长就是由于FGF5基因突变所致[17]。此后,很多研究者们开始了一系列有关FGF5与毛发生长的研究。2007年JAMES等人利用家猫作为实验动物进行研究,结果显示FGF5是影响家猫毛发长度的主要因素[18]。SUZUKI等利用体外注射蛋白产物的方法进行了验证实验,结果表明FGF5的蛋白产物在毛囊生长的不同时期都具有影响[19]。此外,有些****发现FGF5在毛发生长及某些老鼠的脱毛过程中也具有调节作用[20]。KREGE等人发现FGF5能够通过影响Sox2的表达从而对皮肤毛囊的再生起到非常重要的影响[21]。笔者一直致力于如何提高辽宁绒山羊的绒毛产量及品质的研究,通过大量的试验,最终筛选出了MT和FGF5这两种药物,其中MT处理组中1.0g·L-1 24h、0.2g·L-1 24h、0.2g·L-1 72h三个处理条件最有利于辽宁绒山羊皮肤成纤维细胞的增殖与生长,FGF5处理组中10-4 g·L-1 24 h、10-4 g·L-1 72 h、10-6 g·L-1 24 h三个处理条件最适宜辽宁绒山羊皮肤成纤维细胞的增殖与生长。长链非编码RNA(long noncoding RNA, LncRNA)是由RNA聚合酶Ⅱ转录的无蛋白质编码功能的调节性非编码RNA,是一类新型的真核生物转录物[22]。目前,人们将其分为:正义LncRNA、反义LncRNA、双向LncRNA、基因内LncRNA和基因间LncRNA 5种主要类型[23]。很多****研究发现lncRNA在多种生命过程中发挥重要作用,并且在细胞及生物体中的调节方式有多种,例如某些LncRNA可作为转录调控因子(或共调控因子)上调或下调某些基因的表达[24]。某些LncRNA在一定程度上对细胞的分化与增殖、生长发育、器官生成、免疫应答及肿瘤发生等多个生命活动都有一定的调节作用[25,26]。REN等通过将幽州黑山羊和渝东白山羊作为实验动物进行研究,他们对色素沉着早期阶段皮肤细胞中的LncRNA进行结构和表达分析,筛选出差异表达的LncRNA,并对LncRNA进行顺式和反式靶基因的预测[27]。ZHU等发现,长链非编码RNA H19转录物与毛囊重建的真皮乳头细胞的诱导能力有关,在次生毛囊中,lncRNA-H19转录物在毛发生长初期阶段的相对表达显着高于毛发生长终期阶段和毛发生长中期阶段,表明lncRNA-H19转录物可能在山羊绒绒纤维的形成和生长中起重要作用[28]。LIN等在毛乳头细胞中发现了有助于毛发生长相关基因表达的LncRNA的表达 [29]。有****通过高通量测序技术对绵羊的LncRNA进行了生物信息学分析, 对绵羊基因组的研究有重大帮助[30]。【本研究切入点】近年来,关于如何提高羊绒产量及品质的研究越来越多。但是,有关MT和FGF5两种药物能否通过影响相关LncRNA的表达进而提高羊绒产量及品质的研究非常少。【拟解决的关键问题】本试验以辽宁绒山羊为研究对象,分别用MT和FGF5处理辽宁绒山羊皮肤成纤维细胞,通过高通量测序技术筛选出差异表达的LncRNA,预测差异表达LncRNA的靶基因,并通过GO和KEGG富集分析筛选出与绒毛生长相关的LncRNA并进行Real-time PCR验证。1 材料与方法
1.1 细胞培养与药物处理
试验于2016年在辽宁师范大学生命科学学院,辽宁省生物技术与分子药物研发重点实验室进行。辽宁绒山羊皮肤成纤维细胞原代培养,用不同浓度及时间的MT和FGF5进行处理, 处理的条件分别为:MT处理组 1.0g·L-1 24h(M1_24H)、0.2g·L-1 24h(M2_24H)、0.2g·L-1 72h(M2_72H); FGF5处理组,10-4 g·L-1 24 h(F4_24H)、10-4 g·L-1 72 h(F4_72H)、10-6 g·L-1 24 h(F6_24H)。1.2 提取RNA
参照宝生物工程(大连)有限公司的 DNase I(RNase Free)使用说明进行操作。1.3 RNA-Seq文库测序
由北京诺禾致源生物信息科技有限公司提供测序服务,测序平台为 Illumina HiseqTM2500,以PE125的测序策略进行测序。利用fastx_toolkit(v0.0.14)软件对得到的Raw reads进行分析。应用Illumina Casva1.8软件通过QPhred=-10log10(e)公式对碱基的质量进行检测。1.4 Mapping以及样品相关性检验
利用Tophat 2(V2.0.9)对过滤后的测序序列与山羊参考基因组进行比对分析,应用cufflinks和scripture软件进行转录本的拼接。1.5 差异表达LncRNA的筛选
首先通过五步筛选法进行基本的筛选,然后利用CPC、CNCI、pfam蛋白结构域及PhyloCSF分析方法进行编码潜能的筛选,这几种方法筛选的交集为候选的LncRNA。然后从候选LncRNA中筛选出差异表达的LncRNA1.6 差异表达的LncRNA靶基因预测
LncRNA是通过与其靶基因mRNA相互作用来发挥作用的,因此采用Pearson相关系数法分析各样本中LncRNA与蛋白编码基因的表达量相关性和共表达分析方法来预测其靶基因。使用cuffdiff(1.7 差异表达LncRNA靶基因的功能富集分析
将差异表达LncRNA的cis和trans靶基因分别做GO和KEGG富集分析。1.8 目标LncRNA的表达验证
首先培养辽宁绒山羊皮肤成纤维原代细胞,用0.2g·L-1的MT和10-4 g·L-1的FGF5分别处理细胞72h后,提取RNA并反转录成cDNA,接下来通过Real-time PCR对差异表达的LncRNA进行验证,引物见表1。Table 1
Table 1
基因 Gene | 引物 Primer | 引物序列(5'→3') Primer sequence(5'→3') | 产物 Products |
β-actin | β-actin -F β-actin -R | GATGGCTACTGCTGCGTCG GGCATACAGGTCCTTTCGG | 208bp |
2 结果
2.1 样品总RNA电泳检测
经过 DNase I(RNase Free)处理,得到辽宁绒山羊皮肤成纤维细胞总RNA样品,然后对各组样品进行琼脂糖凝胶电泳。结果显示试验中提取的辽宁绒山羊皮肤成纤维细胞样品的总RNA 琼脂糖凝胶电泳检测条带清晰,无拖尾和降解现象,表明提取的 RNA 完整性良好,可以用于后续分析(图1)。图1

Fig. 1The electrophoresis results of total RNA in samples
Panel A is the MT treatment group and Figure B is the FGF5 treatment group. In Figure A, lanes 1, 2, 3, and 4 are M2_72H group, M2_24H group, M1_24H group, and control group C; in Figure B, lanes 1, 2, 3, and 4 are F4_24H group, F6_24H group, and F4_72H group, and control group C.
2.2 测序数据质量评估
对RNA-Seq测序得到的数据质量进行检测的结果如表2.1所示。通过表中数据可知,Error rate表示测序错误率,它与碱基质量有关,同时也受测序仪本身、测序试剂、样品等多个因素共同影响,由表中数据可知碱基错误率较低。Q = -10log10p,其中p值是由Phred计算出,它表示一个碱基被识别错误的可能性,Q 值为 10 表示这个碱有90%的概率是正确的, 20 就是 99%。各个样品中绝大部分reads的Q值均大于20。基GC含量相对较高,表明测序序列较稳定。综上,我们认为各个样品的测序序列都具有较高的质量,可以进行后续分析 。Table 2
Table 2
样本 Sample | 原始序列 Raw reads | 过滤后序列 Clean reads | 错误率 Error rate (%) | Q20 Q20 (%) | Q30 Q30 (%) | GC含量 GC content(%) |
C_1 | 48045300 | 46275212 | 0.03 | 96.86 | 93.68 | 48.39 |
C_2 | 48045300 | 46275212 | 0.04 | 94.99 | 90.67 | 48.37 |
M2_72H_1 | 42277089 | 40464850 | 0.03 | 96.34 | 92.55 | 51.77 |
M2_72H_2 | 42277089 | 40464850 | 0.04 | 93.42 | 87.84 | 51.95 |
M2_24H_1 | 50302056 | 48536611 | 0.03 | 96.75 | 93.50 | 48.03 |
M2_24H_2 | 50302056 | 48536611 | 0.03 | 95.04 | 90.73 | 48.03 |
M1_24H_1 | 48057476 | 46336801 | 0.03 | 96.80 | 93.55 | 48.90 |
M1_24H_2 | 48057476 | 46336801 | 0.04 | 94.99 | 90.66 | 48.92 |
F4_24H_1 | 51394058 | 49453178 | 0.03 | 96.82 | 93.65 | 47.67 |
F4_24H_2 | 51394058 | 49453178 | 0.03 | 95.31 | 91.23 | 47.57 |
F4_72H_1 | 49418892 | 47713121 | 0.03 | 96.72 | 93.27 | 52.04 |
F4_72H_2 | 49418892 | 47713121 | 0.04 | 94.71 | 90.09 | 52.26 |
F6_24H_1 | 46346088 | 44739804 | 0.03 | 96.88 | 93.73 | 48.58 |
F6_24H_2 | 46346088 | 44739804 | 0.04 | 94.92 | 90.55 | 48.55 |
2.3 Mapping
通过Tophat 2软件将试验中样品的clean reads分别与NCBI中山羊参考基因组进行比对分析,发现试验中所产生的测序序列定位百分比均低于70%,其中具有多个定位的测序序列占总体的百分比也均低于10%,表明试验中参考基因组选择合适,不存在污染。而且所有样品中Unique Mapping Rate均为80%以上,因此可进行下一步分析。从图2中可以更加直观看出染色体长度和reads总数的关系,染色体的长度与定位到该染色体内reads总数呈正相关,MT处理组和FGF5处理组样品比对到山羊1号、2号染色体上的reads相对来说都比较多。图2

Fig. 2Density distribution of Reads on chromosome
Abscissa: the length of a chromosome (in millions of bases); ordinate: log2 (the median of reads density); green is a positive chain, and red is a negative chain
2.4 样品间相关性检查
样品间表达水平相关性是检验试验可靠性和样本选择是否合理的重要指标。如图3所示,可知各处理组与对照组相比较,R2值均大于0.8, 表明样品间表达水平相关性均较高。因此本试验所选择的样品均符合测序要求,可以继续进行下一步分析。图3

Fig. 3Correlation between samples in each treatment group
2.5 差异表达的LncRNA的筛选
筛选的条件是P-adjust <0.05,log2(Fold change) >1。由图4可知,在M1_24H与C进行比较,获得32个差异表达的LncRNA,其中有4个LncRNA上调,28个下调;M2_24H与C组进行比较,获得10个差异表达的LncRNA,其中有4个LncRNA上调,6个下调;M2_72H与C组中进行比较,获得113个差异表达的LncRNA,其中有5个LncRNA上调,108个下调;F6_24H与C进行比较,获得123个差异表达的LncRNA,27个上调,96个下调;F4_24H与C进行比较,获得164个差异表达的LncRNA,70个上调,94个下调;F4_72H与C组中进行比较,获得189个差异表达的LncRNA,其中有78个上调,111个下调。图4

Fig. 4Differentially expressed LncRNA distribution
Red dots represent the up-regulated LncRNA and green dots represent the down-regulated LncRNA; Abscissa represents expression level of LncRNA; Ordinate represents statistical significance of LncRNA expression level.
根据不同样品中差异表达的LncRNA表达水平的高低,进行层次聚类(hierarchical clustering)分析,从而判断这些LncRNA在不同试验条件下的表达模式(图5)。结果显示在F4_24H组和M2_72H中差异表达的LncRNA表达水平相对较高。

Fig. 5Differentially expressed LncRNA clusters
Each column represents a sample and each row a gene; High relative expression of LncRNA is indicated by red and low relative expression of LncRNA by green.
2.6 差异表达的LncRNA靶基因Gene Ontology功能显著性富集分析
分别根据LncRNA临近位置的(上下游10k /100k)蛋白编码基因和LncRNA与蛋白编码基因的表达量相关性分析或共表达分析方法来预测其cis/trans靶基因。再对靶基因分别进行cis和trans的GO富集分析,分别从生物过程(biological process,BP)、分子功能(molecular function,MF)和细胞组分(cellular component,CC)三个层面对靶基因进行GO注释。结果如表3、4所示:M2_24H vs C、F4_24H vs C和 F6_24H vs C组中差异表达的LncRNA均无显著富集的条目;M1_24H vs C组中差异表达LncRNA的trans靶基因无显著富集的GO term,其cis靶基因只在BP中有一个显著富集的GO term,即negative regulation of transcription from RNA polymerase II promoter;M2_72H vs C和F4_72H vs C组中差异表达的LncRNA的cis靶基因均无显著富集的GO term,而M2_72H vs C组trans靶基因主要富集在BP的cellular metabolic process biological_process、nitrogen compound metabolic process biological_process;MF中的binding molecular_function、catalytic activity molecular_function;CC中的membrane- bounded organelle cellular_component、F4_72H vs C组中差异表达的LncRNA的 rans靶基因主要富集在BP的cellular metabolic process biological_process、cellular macromolecule metabolic process biological_process,CC的cell cellular_component、cell part cellular_component、intracellular cellular_component,MF的binding molecular_ function中。Table 3
表3M2_72H vs C组差异表达LncRNA靶基因GO term分类
Table 3
条目类型 Term_type | 功能 Features | 过表达的P值 Over_represented P value | 校正的P值 Corrected P value |
生物过程 Biological_process (BP) | 细胞代谢过程 Cellular metabolic process | 7.15E-06 | 0.003923 |
氮化合物代谢过程 Nitrogen compound metabolic process | 8.48E-06 | 0.0039252 | |
细胞氮化合物代谢过程 Cellular nitrogen compound metabolic process | 1.67E-05 | 0.0063413 | |
有机氮化合物代谢过程 Organonitrogen compound metabolic process | 8.12E-05 | 0.019891 | |
细胞芳香化合物代谢过程 Cellular aromatic compound metabolic process | 3.26E-05 | 0.0097043 | |
杂环代谢过程 Heterocycle metabolic process | 5.36E-05 | 0.013956 | |
有机环状化合物代谢过程 Organic cyclic compound metabolic process | 3.84E-05 | 0.01066 | |
染色体组织 Chromosome organization | 9.55E-05 | 0.022102 | |
含核碱基的化合物代谢过程 Nucleobase-containing compound metabolic process | 0.00011221 | 0.024598 | |
染色质修饰 Chromatin modification | 0.00025719 | 0.04581 | |
细胞成分组织或生物发生 Cellular component organization or biogenesis | 0.00026397 | 0.04581 | |
细胞组分Cellular_component (CC) | 核 Nucleus | 1.48E-06 | 0.0031426 |
膜结合的细胞器 Membrane-bounded organelle | 3.52E-06 | 0.003923 | |
细胞内膜结合细胞器 Intracellular membrane-bounded organelle | 4.25E-06 | 0.003923 | |
染色体 Chromosome | 0.00022214 | 0.042055 | |
分子功能Molecular_function (MF) | 核酸酶活性 Nuclease activity | 1.51E-06 | 0.0031426 |
腺苷酸核苷酸结合 Adenyl nucleotide binding | 5.49E-06 | 0.003923 | |
腺苷核糖核苷酸结合 Adenyl ribonucleotide binding | 7.54E-06 | 0.003923 | |
ATP结合 ATP binding | 6.43E-06 | 0.003923 | |
蛋白质结合 Protein binding | 1.65E-05 | 0.0063413 | |
细胞因子活性 Cytokine activity | 3.00E-05 | 0.0096034 | |
水解酶活性,作用于酯键 Hydrolase activity, acting on ester bonds | 0.00012043 | 0.02508 | |
催化活性 Catalytic activity | 0.00021879 | 0.042055 | |
结合物 Binding | 1.90E-05 | 0.0065865 |
Table 4
表4F4_72H vs C组差异表达LncRNA靶基因的GO term分类
Table 4
条目类型 Term_type | 功能 Features | 过表达的P值 Over_represented P value | 校正的P值 Corrected P value | |
生物过程Biological_process (BP) | 细胞代谢过程 Cellular metabolic process | 1.22E-06 | 0.002285 | |
生物合成过程 Biosynthetic process | 3.29E-06 | 0.002285 | ||
有机物生物合成过程 Organic substance biosynthetic process | 6.96E-06 | 0.0034462 | ||
细胞生物合成过程 Cellular biosynthetic process | 8.88E-06 | 0.0034462 | ||
细胞大分子代谢过程 Cellular macromolecule metabolic process | 9.10E-06 | 0.0034462 | ||
基因表达 Gene expression | 1.87E-05 | 0.0051872 | ||
细胞蛋白质代谢过程 Cellular protein metabolic process | 2.03E-05 | 0.0052866 | ||
翻译 Translation | 3.43E-05 | 0.0071461 | ||
高分子生物合成过程 Macromolecule biosynthetic process | 7.00E-05 | 0.013255 | ||
细胞大分子生物合成过程 Cellular macromolecule biosynthetic process | 8.41E-05 | 0.015233 | ||
有机环状化合物代谢过程 Organic cyclic compound metabolic process | 9.81E-05 | 0.017021 | ||
细胞氮化合物代谢过程 Cellular nitrogen compound metabolic process | 0.0001207 | 0.019468 | ||
细胞芳香化合物代谢过程 Cellular aromatic compound metabolic process | 0.00012153 | 0.019468 | ||
细胞芳香化合物代谢过程 Nitrogen compound metabolic process | 0.00013872 | 0.021399 | ||
蛋白质定位 Protein localization | 0.00015944 | 0.023716 | ||
杂环代谢过程 Heterocycle metabolic process | 0.00018062 | 0.025736 | ||
DNA复制,合成RNA引物 DNA replication, synthesis of RNA primer | 0.00023573 | 0.031671 | ||
含核碱基的化合物代谢过程 Nucleobase-containing compound metabolic process | 0.00038174 | 0.045427 | ||
胞组分Cellular_component (CC) | 细胞内部分 Intracellular part | 9.95E-08 | 0.00041428 | |
细胞质 Cytoplasm | 1.93E-06 | 0.002285 | ||
细胞内膜结合细胞器 Intracellular membrane-bounded organelle | 2.49E-06 | 0.002285 | ||
膜结合的细胞器 Membrane-bounded organelle | 3.16E-06 | 0.002285 | ||
细胞 Cell | 7.88E-06 | 0.0034462 | ||
细胞部分 Cell part | 7.88E-06 | 0.0034462 | ||
细胞内 Intracellular | 1.34E-05 | 0.0046662 | ||
细胞质部分 Cytoplasmic part | 1.65E-05 | 0.0049423 | ||
核 Nucleus | 1.66E-05 | 0.0049423 | ||
细胞内细胞器 Intracellular organelle | 2.56E-05 | 0.0061674 | ||
细胞器 Organelle | 2.69E-05 | 0.0061674 | ||
大分子复合物 Macromolecular complex | 2.81E-05 | 0.0061674 | ||
核部分 Nuclear part | 4.41E-05 | 0.0087498 | ||
膜封闭的管腔 Membrane-enclosed lumen | 0.00018537 | 0.025736 | ||
细胞器腔 Organelle lumen | 0.00025929 | 0.032725 | ||
细胞内细胞器腔 Intracellular organelle lumen | 0.00025929 | 0.032725 | ||
内膜系统 Endomembrane system | 0.00031133 | 0.038138 | ||
蛋白质复合物 Protein complex | 0.00047111 | 0.049055 | ||
核腔 Nuclear lumen | 0.00048565 | 0.049335 | ||
分子功能Molecular_function (MF) | 连接酶活性,形成碳 - 氧键 Ligase activity, forming carbon-oxygen bonds | 0.00040555 | 0.045652 | |
连接酶活性,形成氨酰-tRNA和相关化合物 Ligase activity, forming aminoacyl-tRNA and related compounds | 0.00040555 | 0.045652 | ||
腺苷酸核苷酸结合 Adenyl nucleotide binding | 0.00043007 | 0.047138 | ||
结合物 Binding | 0.00046 | 0.049055 |
2.7 差异表达的LncRNA靶基因Pathway显著性富集分析
通过KEGG数据库,对样品中差异表达LncRNA的靶基因进行通路富集分析,得到各比较组合中显著性富集(Qvalue<0.05)的pathway term。结果如表5—9所示:M2_24H vs C和F4_24H vs C组中均无显著富集的pathway term;F6_24H vs C组中差异表达的LncRNA的trans靶基因无显著富集的pathway term,其cis靶基因只富集在Taste transduction通路;M2_72H vs C、M1_24H vs C和F4_72H vs C组中差异表达的LncRNA的cis靶基因均无显著富集的pathway term,M2_72H vs C 组差异表达的LncRNA的trans靶基因显著富集到15个pathway term,其中TNF和NF-kappa B 信号通路与毛囊发育及绒毛周期性生长相关,其通路中差异表达的靶基因、M1_24H vs C组差异表达的LncRNA的trans靶基因只富集在Steroid biosynthesis通路、F4_72H vs C组中差异表达的LncRNA的trans靶基因显著富集到9个pathway term,其中只有Metabolic信号通路与毛囊发育及绒毛周期性生长相关,其通路中差异表达的靶基因。Table 5
表5M2_72H vs C组Pathways富集数据表
Table 5
通路 Pathway | 通路ID Pathway ID | 样本编号 Sample number | 背景编号 Background number | 校正的P值 Corrected P value |
细胞周期 Cell cycle | chx04110 | 62 | 116 | 1.30736872661e-07 |
DNA复制 DNA replication | chx03030 | 26 | 34 | 1.97822480896e-07 |
范可尼贫血症 Fanconi anemia | chx03460 | 29 | 50 | 0.000199893004074 |
错配修复 Mismatch repair | chx03430 | 15 | 22 | 0.00320771571904 |
赖氨酸降解 Lysine degradation | chx00310 | 25 | 50 | 0.0157486842455 |
癌症中的微小RNA MicroRNAs in cancer | chx05206 | 50 | 127 | 0.0399507008006 |
阿尔茨海默氏病 Alzheimer's disease | chx05010 | 61 | 164 | 0.0467892160603 |
类固醇生物合成 Steroid biosynthesis | chx00100 | 12 | 20 | 0.0467892160603 |
TNF | chx04668 | 39 | 97 | 0.0467892160603 |
Nod样受体 Nod-like receptor | chx04621 | 22 | 47 | 0.0467892160603 |
嘧啶代谢 Pyrimidine metabolism | chx00240 | 37 | 91 | 0.0467892160603 |
RNA转运 RNA transport | chx03013 | 54 | 144 | 0.0467892160603 |
柠檬酸循环 Citrate cycle | chx00020 | 16 | 31 | 0.0467892160603 |
同源重组 Omologous recombination | chx03440 | 14 | 26 | 0.0467892160603 |
NF-kappa B | chx04064 | 32 | 77 | 0.0467892160603 |
Table 6
表6M2_72H vs C组差异表达基因富集的绒毛生长相关信号通路
Table 6
通路 Pathway | 基因ID Gene ID | 基因名称 Gene name | 方式 Style |
TNF NF-kB | 100861232 102169137 102172758 102186424 100861171 102182977 100860785 102188524 100861236 102185051 100861232 102182977 102169137 102191581 102178438 | TNFα NFKBIA PIK3R5 NOD2 MT1MMP TNFAIP3 IL6 LIF IL18R1 CSF1 TNFα TNFAIP3(A20) NFKBIA(IKBα) NFKB2 IL8 | UP UP UP UP UP UP UP UP UP UP UP UP UP UP UP |
Table 7
Table 7
样本名称 Sample name | 显著富集的信号通路 Significantly enriched signaling pathway | Q值 Qvalue | |
F4_24H vs C | cis靶基因 cis target gene | 无 No | - |
trans靶基因 trans target gene | 无 No | - | |
F4_72H vs C | cis靶基因 cis target gene | 无 No | - |
trans靶基因 trans target gene | 核糖体 Ribosome RNA转运 RNA transport 范可尼贫血途径 Fanconi anemia pathway 亨廷顿氏病 Huntington's disease 代谢途径 Metabolic pathway 氨酰基-tRNA生物合成 Aminoacyl-tRNA biosynthesis 柠檬酸循环(TCA循环) Citrate cycle (TCA cycle) 阿尔茨海默氏病 Alzheimer's disease 泛素介导的蛋白水解 Ubiquitin mediated proteolysis | 0.001 0.018 0.018 0.018 0.025 0.029 0.033 0.033 0.037 | |
F6_24H vs C | Cis靶基因 Cis target gene | 味觉转导 Taste transduction | 0.022 |
Trans靶基因 Trans target gene | 无 No | - |
Table 8
Table 8
通路 Pathway | 通路ID Pathway ID | 样本编号 Sample number | 背景编号 Background number | 校正后的P值 Corrected P-value |
核糖体 Ribosome | chx03010 | 36 | 129 | 0.001 |
RNA转运 RNA transport | chx03013 | 34 | 144 | 0.018 |
范可尼贫血途径 Fanconi anemia pathway | chx03460 | 16 | 50 | 0.018 |
亨廷顿氏病 Huntington's disease | chx05016 | 38 | 171 | 0.018 |
代谢途径 Metabolic pathway | chx01100 | 178 | 1126 | 0.025 |
氨酰基-tRNA生物合成 Aminoacyl-tRNA biosynthesis | chx00970 | 14 | 44 | 0.029 |
柠檬酸循环(TCA循环) Citrate cycle (TCA cycle) | chx00020 | 11 | 31 | 0.033 |
阿尔茨海默氏病 Alzheimer's disease | chx05010 | 35 | 164 | 0.033 |
泛素介导的蛋白水解 Ubiquitin mediated proteolysis | chx04120 | 28 | 124 | 0.037 |
味觉转导 Taste transduction | chx04742 | 2 | 35 | 0.022 |
Table 9
表9F4_72H vs C组差异表达基因富集的绒毛生长相关信号通路
Table 9
通路 Pathway | 基因ID Gene ID | 基因名称 Gene name | 方式 Style |
氨基酸代谢通路 Metabolic pathway | 102172231 | CTH | UP |
102190784 | PSAT1 | UP | |
102178128 | PHGDH | UP | |
102184920 | NAPRT1 | UP | |
102187590 | GCNT1 | UP | |
102179919 | SHMT2 | UP | |
102186540 | FDPS | UP | |
102171848 | DHCRT | UP | |
102184667 | CBS | UP |
2.8 目标LncRNA的表达验证
M2_72H组LcRNA靶基因富集的NF-κB信号通路中靶基因TNFα、TNFAIP3(A20)、NFKBIA(IkBα)、NFKB2、IL8所对应的LncRNA有两个,分别为(Gene ID):XLOC_005914;XLOC_018763。F4_72H 组靶基因富集的Metabolic 信号通路中靶基因所对应的LncRNA有4个,分别为(Gene ID):XLOC_011424、XLOC_009522、XLOC_009063、XLOC_01115。通过Real-time PCR对筛选出的6个LncRNA进行验证,结果如图7所示,MT作用相关的两个LncRNA在RNA- Seq中的表达量上调,Real-time PCR检测结果与RNA- Seq测序结果一致,进一步验证了RNA-Seq测序结果的准确性。FGF5处理辽宁绒山羊皮肤成纤维细胞后,Real-time PCR结果为LncRNA XLOC_011424和XLOC_011157表达量下调;LncRNAXLOC_009063表达量上调; LncRNA XLOC_009522表达量无显著性差异。结合RNA-Seq测序中4个LncRNA表达量均下调的结果,表明LncRNA XLOC_011424、LncRNA XLOC_011157与前期结果一致。图7

图7Real-time PCR验证RNA-Seq中相关的LncRNA表达水平
Fig. 7Real-time PCR verifies correlated LncRNA expression in RNA-Seq
3 讨论
本试验通过KEGG富集分析,共筛选出了3个与绒毛生长相关的信号通路,分别为TNF、NF-κB和Metabolic信号通路。KLOEPPERT等研究发现,NF-κB在维持人类毛囊的生长期阶段具有功能重要性。人类毛发生长初期,头皮毛囊快速增殖的毛发基质上皮中,NF-κB活性非常显著,关键的毛发生长调节剂如TNFα和IL-1通过调控NF-κB信号通路从而影响绒毛生长[35]。核因子(NF)-κB途径参与毛囊的形态发生,Gilon M、Sher N、Cohen S和 Gat U通过瞬时转染技术分析了p65 / RelA(一种NF-kB效应子)对毛发角蛋白(HK)调节区的影响,结果表明p65能够诱导人和小鼠来源的几种酸性毛发角蛋白5(Ha5)的转录激活,p65与Ha5基因调节区域中的NF-κB/ RelA结合位点直接结合[36]。NF-κB/ Rel转录因子和IkappaB激酶(IKK)参与骨形态发生,皮肤增殖和分化等过程。另外,SCHMIDT-ULLRICH等研究发现,抑制NF-κB的小鼠会出现毛囊缺陷[37]。皮肤干细胞可以再生表皮附属物。然而,由于受伤而损失的毛囊几乎没有再生。WANG等研究显示,伤口中的巨噬细胞激活毛囊干细胞,导致伤口周围的毛囊在休止期向生长期过渡,毛囊再生等过程,主要通过TNF信号传导调控[38]。LAURIKKALA等发现,外异蛋白(ED1)和外异蛋白A受体(EDAR)作为新的TNF配体-受体对的鉴定表明,TNF信号在胚胎形态发生中的作用,另外他们认为ED1/EDAR信号传导也调节毛囊的形态发生[39]。
蛋白质是生命活动的主要承担者,而氨基酸是构成蛋白质分子的基本单位。L-半胱氨酸目前被认为是条件必需的硫氨基酸,不仅是角蛋白的关键组分,还可以促进许多生物途径[40]。角蛋白相关蛋白8.1基因(KAP8.1)是一种负责羊绒的结构基因。KAP8.1蛋白含有高甘氨酸和酪氨酸,参与基质结构纤维的调节。ZHAO等认为KAP8.1基因的多态性可能与纤维直径有关[41]。TONG等发现,原代培养物中的角蛋白17(K17)无效时,皮肤角质形成细胞对TNFα选择性更敏感。K17与TNF受体1(TNFR1)相关的死亡域蛋白(TRADD)相互作用,这是一种必需的死亡适配体TNFR1依赖性信号传递,而且NF-κB(TNFα的下游靶标)的活性在K17无效皮肤中增加[42]。Wnt信号通路是毛囊发育中重要的途径之一,次级毛囊中成纤维细胞生长因子21和酪蛋白激酶是Wnt途径中β-连环蛋白的重要调节因子。天冬酰胺和丝氨酸可能在初级毛囊生长过程中具有重要作用[43]。由此可见,Metabolic、NF-kB 、TNF三个信号通路对绒毛生长发育有着十分重要的作用。
LncRNA是影响绒毛生长的重要因素之一。近几年,关于LncRNA影响绒毛生长的研究越来越多。BAIA等研究表明,LncRNA(LncRNA-599618、-599556、-599554、-599547、-599531和-599509)在毛发生长初期阶段的表达量显着高于毛发生长终期阶段[31]。CAI 等发现,LncRNA5322能够通过靶向毛囊干细胞中miR-21介导的PI3K-AKT信号传导途径来促进毛囊干细胞的增殖和分化[32]。ZHOU 等在山羊皮肤中鉴定了1 122种已知的和403种新的LncRNA,其中173种在毛发生长初期和退化期之间差异表达。另外他们发现,LncRNA和miRNA在毛囊生长转变中协同作用,并且退行期诱导因子(TGFβ1和BDNF)在miRNA-miRNA-mRNA网络中由miR-873和Lnc108635596调节[33]。SONG等研究表明,LncRNA XLOC_539599,XLOC_556463,XLOC_015081,XLOC_1285606,XLOC_297809和XLOC_764219对原发性羊毛毛囊诱导具有潜在的重要性,且差异表达的LncRNA的潜在靶基因在NF-κB信号通路显著富集[34]。
本试验,利用高通量测序和Real-time PCR技术在Metabolic、NF-kB 、TNF 3个信号通路靶基因对应的LncRNA中共筛选出4个与辽宁绒山羊绒毛生长相关的LncRNA,分别为:LncRNA XLOC_ 011424、XLOC_011157、XLOC_005914、XLOC_ 018763。因此,可以认为MT和FGF5两种药物处理,可通过影响某些相关LncRNA的表达,进而影响绒毛生长。
4 结论
LncRNA XLOC_011424、XLOC_011157、XLOC_ 005914和XLOC_018763可能通过增加羊绒密度及长度,进而提高辽宁绒山羊羊绒产量及品质。其中,前两个LncRNA通过调节其上游或下游的靶基因,调节TNF或NF-kB信号通路,进而影响绒毛的生长。LncRNA XLOC_011424和XLOC_011157通过调节其与Metabolic pathway相关的靶基因从而影响绒毛生长。笔者所选择的两种药物中,MT更能引起某些与绒毛生长相关LncRNA的差异表达从而影响绒毛生长。但是这4种LncRNA具体的功能和作用机制尚不清楚,后续试验研究将集中探讨LncRNA促进绒毛纤维生长的作用机制。(责任编辑 林鉴非)
