肺鳞状细胞癌发生的早期标志物及肿瘤预测模型
尚文慧,王晓曦,李晓琴,高斌
(北京工业大学 生命科学与生物工程学院,北京 100124)
摘要:
选取癌症基因组图谱数据库的肺鳞状细胞癌(Lung Squamous Cell Carcinoma,LUSC)样本作为数据集,在全基因组的水平上研究肺鳞状细胞癌病人从正常到发病I期基因表达的变化,寻找与LUSC发病密切相关的早期标志物,并建立一种基于早期标志基因的肿瘤预测模型。方法 采用模式识别分类法和基因通路和功能分析相结合的筛选方法,对LUSC的早期标志物进行识别,并运用Fisher判别建立肿瘤预测模型。得到12个LUSC的早期标志物,分别是CLDN18, CD34, ESAM, JAM2, CDH5, F11, F8, CFD, MRC1, MARCO, SFTPA2 和 SFTPA1,机器学习建模后对LUSC早期癌症样本和正常肺组织样本的分类精度达到了98%以上。由基因SFTPA1和ESAM建立的LUSC早期肿瘤预测模型,对正常肺组织和LUSC肿瘤Ⅰ期样本的分类敏感性和特异性分别为99.18%和100%,并且独立验证集的分类准确率也在90%以上。结论 筛选出的12个早期分子标志物有望成为LUSC诊断的标志分子,并且建立的肿瘤预测模型具有极高的准确性,可以为LUSC的发生机理研究以及早期肿瘤预测提供帮助。
关键词: 肺鳞状细胞癌 基因表达 肿瘤发生 早期标志物 诊断模型
DOI:10.12113/202002004
分类号:Q7;Q81
文献标识码:A
基金项目:国家自然科学基金项目(No.11572014);国家科技部重点研发项目(No.2017YFC0111104).
Early markers and tumor prediction models of lung squamous cell carcinoma
SHANG Wenhui, WANG Xiaoxi, LI Xiaoqin, GAO Bin
(College of Life Science and Bioengineering, Beijing University of Technology, Beijing 100124,China)
Abstract:
Lung squamous cell carcinoma(LUSC) samples selected from the cancer genome atlas (TCGA) database were used as dataset to investigate differences of gene expression in cancer patients from normal to stage I cancer at the whole genome-level. Early molecular markers of LUSC were explored, and a tumor prediction model based on early marker genes was established. The early markers of LUSC were identified by the combination of pattern recognition classification, gene pathway and functional analysis, and the prediction model was established by Fisher discriminant. According to the screening procedure, 12 early markers of LUSC were obtained, namely CLDN18, CD34, ESAM, JAM2, CDH5, F11, F8, CFD, MRC1, MARCO, SFTPA2,and FTPA1.Modeling by machine learning method, the classification accuracy rate of early cancer samples and normal lung tissue samples of LUSC was over 98%. Based on the selected early LUSC markers, the Fisher discriminant analysis method was used to establish a prediction model. The specificity and sensitivity of the LUSC early tumor prediction model established on the basis of SFTPA1and ESAMfor normal lung tissue and stage I cancer samples were 100% and 99.18%, respectively. The classification accuracy of the independent validation set was more than 90%. The 12 early molecular markers are expected to be the marker molecules for the diagnosis of LUSC, and the established tumor prediction model has high accuracy, which can be helpful for the study of the pathogenesis of LUSC and early tumor prediction.
Key words: Lung squamous cell carcinoma Gene expression Tumorigenesis Early markers Prediction model
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
肺鳞状细胞癌发生的早期标志物及肿瘤预测模型
本站小编 哈尔滨工业大学/2020-12-05
相关话题/肿瘤 基因
合成生物学基因设计软件:iGEM设计综述
合成生物学基因设计软件:iGEM设计综述伍克煜1,刘峰江1,许浩1,张浩天1,王贝贝1,2(1.电子科技大学生命科学与技术学院,成都611731;2.电子科技大学信息生物学研究中心,成都611731)摘要:随着基因回路规模的扩大,和应用范围的拓展,传统的合成基因回路的设计思路面临着新的挑战。新合成基 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05蒺藜苜蓿多聚半乳糖醛酸酶基因家族的全基因组分析
蒺藜苜蓿多聚半乳糖醛酸酶基因家族的全基因组分析胡龄予,伊霖晟,刘冬雪,王阳,杨欢欢,张鑫茹,杨爽,束永俊(哈尔滨师范大学生命科学与技术学院,哈尔滨150025)摘要:多聚半乳糖醛酸酶(Polygalacturonases,PGs)是一种果胶水解酶,参与果实成熟、器官脱落、花粉成熟等多个植物发育过程。 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05生物信息学方法筛选胶质母细胞瘤的核心基因
生物信息学方法筛选胶质母细胞瘤的核心基因柯帅,王文波,廖红展,彭志柱,邱县生,唐慧敏,李清华,夏学巍(桂林医学院附属医院神经外科,广西桂林541000)摘要:多形性胶质母细胞瘤(GBM)是成人最常见的恶性神经上皮肿瘤,关于其诊断和治疗的靶点研究一直是困扰研究者的难题。采用生物信息学的方法对GBM的基 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05医学遗传学2.0:导致人类慢病的主因可能首先是人体共生微生物基因异常,其次才是人类基因异常
医学遗传学2.0:导致人类慢病的主因可能首先是人体共生微生物基因异常,其次才是人类基因异常张成岗(军事科学院军事医学研究院辐射医学研究所,全军军事认知与心理卫生研究中心,北京100850)摘要:当前慢病高发的现实对“健康中国2030”战略目标的实现提出了巨大挑战。虽然众多医疗机构和政府管理部门付出巨 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05Hsa-miR-210-5p靶基因预测及其相关信号通路的生物信息学分析
Hsa-miR-210-5p靶基因预测及其相关信号通路的生物信息学分析蔡丹平,龙鼎新(南华大学船山学院,湖南衡阳421001)摘要:为深入研究miR-210-5p的调控机制及生物学功能提供理论机制,应用生物信息学方法分析miR-210-5p序列,预测其靶基因,用Veney2.1.0绘制韦恩图得到靶基 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05大鼠颅脑损伤后差异表达基因及miRNA研究
大鼠颅脑损伤后差异表达基因及miRNA研究王家昕,王晓霞,李洁,苗泽远,倪爽,王子钰,苏立宁(河北北方学院基础医学院,河北张家口075000)摘要:研究背景创伤性脑损伤(Traumaticbraininjury,TBI)是致死率和致残率极高的外科疾患,我国在对于TBI的判断、治疗等方面还处于薄弱阶段 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05MutPrimerDesign:用于人类基因编码区域突变位点的引物设计程序
MutPrimerDesign:用于人类基因编码区域突变位点的引物设计程序曹英豪,彭公信(中国医学科学院基础医学研究所&北京协和医学院基础医学院,北京100730)摘要:位于基因编码区的DNA突变与基因的功能密切相关。在已知人类基因编码区的突变位点时,如何在基因组上设计引物验证该突变是一个重要的问题 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05毛竹SWEET基因家族的全基因组鉴定与分析
毛竹SWEET基因家族的全基因组鉴定与分析李新然1,2,张智俊1,2,喻珮瑶1,2,陈家璐1,2,马瑞芳1,2,刘笑雨1,2(1.浙江农林大学省部共建亚热带森林培育国家重点实验室,杭州311300;2.浙江农林大学林业与生物技术学院,杭州311300)摘要:糖外排转运蛋白(Sugarswillev ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05基于全基因组序列的弯曲菌特征分析
基于全基因组序列的弯曲菌特征分析孙磊1,2,3,杨臻辉1,2,恽茜3,4,黄金林3,4(1.扬州大学信息工程学院,江苏扬州225127;2.扬州大学人工智能学院,江苏扬州225127;3.江苏省人兽共患病学重点实验室,江苏扬州225009;4.江苏省动物重要疫病与人兽共患病防控协同创新中心,江苏扬州 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05通过miRNA基因表达谱的基因共表达网络构建对星形细胞瘤的基因靶标进行预测
通过miRNA基因表达谱的基因共表达网络构建对星形细胞瘤的基因靶标进行预测邵嘉敏(石门县人民医院神经外科,湖南,常德415000)摘要:星形细胞瘤为浸润性生长肿瘤,生长缓慢,多为隐形症状,难以早期发现。多数肿瘤切除后有复发可能,且复发后肿瘤可演变成间变性星形细胞瘤或多形性胶质母细胞瘤。因此寻找其生物 ...哈尔滨工业大学科研学术 本站小编 哈尔滨工业大学 2020-12-05