招生信息
教育背景
工作经历
专利与奖励
出版信息
合作情况
指导学生
基本信息
殷鹏男博导中国科学院深圳先进技术研究院、中国科学院深圳理工大学(筹)
电子邮件: peng.yin@siat.ac.cn
通信地址: 深圳市南山区西丽深圳大学城学苑大道1068号
邮政编码: 518055
研究内容
我们只有一个地球,我们只有一次生命,珍惜健康,享受生活!
课题组以生物医学大数据作为主要研究方向,利用统计模型和机器学习方法,对医学大数据进行数据分析、数据挖掘,以发现疾病风险因子(环境因素)、生物标志物(遗传因素)、药物靶标(病因发现)为主要研究目标。充分利用多维度、多模态的健康医疗数据,对疾病表型进行关联分析。
(1)基于UK biobank 等人群队列的机器学习方法研究与应用(Machine Learning for Association/Interaction):整合临床信息、全基因组信息、血检信息、代谢组数据以及影像信息,对心脑血管、精神疾病等复杂疾病进行关联分析,对疾病表型进行预测。使用统计模型和机器学习分析不同模态数据间的交互作用。
(2)整合GWAS,QTL,组织特异性网络等数据的因果分析(Graph model for Causal gene):GWAS刻画表型 (Phenotype)--基因突变关联关系,QTL刻画基因突变 -- 基因表达关联关系,组织特异性网络刻画不同基因表达间作用关系,使用图模型进行因果分析,推演致病的关键核心基因(Omnigenic)。
(3)人工智能辅助药物靶标发现(AI for DrugTarget):融合蛋白序列,结构,功能信息的数据表征学习,对蛋白--药物,蛋白--疾病,蛋白--蛋白等关联预测;利用生成模型,强化学习等算法ab initio 设计化合物。
关键词:统计机器学习,基因/蛋白多组学,多模态与可解释性
欢迎加入我们!
招生信息
博士后(全年招,待遇好,快砸简历!)
全日制、非全日制 硕士、博士研究生 (国科大学位,不愁找工作!)
优秀的本科生、研究生可以来做客座实习(接收1年左右的客座实习)
招生专业
081203-计算机应用技术085400-电子信息招生方向
计算生物学医学统计学人工智能教育背景
2009-10--2014-02英国纽卡斯尔大学博士2005-09--2009-07中国科学技术大学本科工作经历
工作简历
2017-02~现在,中国科学院深圳先进技术研究院,副研究员2014-02~2017-02,英国利物浦大学,博士后社会兼职
2019-05-18-今,中国医促会健康大数据和数字化医疗分会, 青年学术部委员2019-04-11-今,深圳市人工智能协会, 会员
2018-01-01-今,国家发改委健康大数据智能分析技术国家地方联合工程研究中心, 副主任
2017-10-31-今,CCF中国计算机协会, 会员
2015-06-01-今,国际遗传流行病学会, 会员
2015-02-01-今,英国皇家统计协会, 会员
专利与奖励
奖励信息
(1) 英国利物浦大学ITM学院优秀项目和奖金, , 研究所(学校), 2016(2) 美国人类遗传学会会议(ASHG)2015 Reviewers’ Choice Abstract, , 其他, 2015(3) 英国利物浦大学NWCR travel award, 其他, 2015(4) 英国 Wellcome Trust 资助, 研究所(学校), 2010(5) 英国纽卡斯尔大学全额奖学金, 研究所(学校), 2009专利成果
( 1 ) 心电图检测方法, 发明, 2017, 第 5 作者, 专利号: 5.6( 2 ) (PCT专利) 骨密度性状遗传力分析方法及装置, 发明, 2018, 第 2 作者, 专利号: PCT/CN2018/121861( 3 ) (PCT专利) 数据特征提取方法、装置及电子设备, 发明, 2018, 第 3 作者, 专利号: PCT/CN2018/121838( 4 ) (PCT专利)一种基于多组学集成的癌症亚型分类方法, 发明, 2018, 第 2 作者, 专利号: PCT/CN2018/121838( 5 ) 骨密度性状遗传力分析方法及装置, 发明, 2020, 第 2 作者, 专利号: ZL0.6( 6 ) 一种小分子抑制剂在抑制病毒沉默抑制蛋白中的应用, 发明, 2018, 第 5 作者, 专利号: 6.6( 7 ) 数据特征提取方法、装置及电子设备, 发明, 2018, 第 3 作者, 专利号: 4.7( 8 ) 差异表达基因筛选方法及装置, 发明, 2018, 第 2 作者, 专利号: 9.2( 9 ) 病历数据预测方法、装置及电子设备, 发明, 2018, 第 2 作者, 专利号: 4.1( 10 ) 一种基于多组学集成的癌症亚型分类方法, 发明, 2018, 第 2 作者, 专利号: 3.3( 11 ) 集合间相似度的确定方法和装置, 发明, 2020, 第 1 作者, 专利号: ZL9.5出版信息
发表论文
(1)Multi?PLI: interpretable multi‐task deep learning model for unifying protein–ligand interaction datasets,Journal of Cheminform,2021,通讯作者(2)A Genome-wide Association Study of Circulating Levels of Atorvastatin and Its Major Metabolites,Clinical Pharmacology & Therapeutics,2020,第5作者(3)Structure Enhanced Protein-Drug Interaction Prediction using Transformer and Graph Embedding,IEEE International Conference on Bioinformatics and Biomedicine,2020,通讯作者(4)Generating Novel Compounds Targeting SARS-CoV-2 Main Protease Based on Imbalanced Dataset,IEEE International Conference on Bioinformatics and Biomedicine,2020,通讯作者(5)Prediction of potential commercially inhibitors against SARS-CoV-2 by multi-task deep model,arXiv,2020,通讯作者(6)DeepBindRG: a deep learning based method for estimating effective protein–ligand affinity,PeerJ,2019,通讯作者(7)Multivariate Time Series Missing Data Imputation Using Recurrent Denoising Autoencoder.,BIBM,2019,通讯作者(8)Interpretable Prediction of Protein-Ligand Interaction by Convolutional Neural Network,BIBM,2019,通讯作者(9)Simulation-based sensitivity analysis for non-ignorably missing data,Statistical Methods in Medical Research,2019,第1作者(10)Susceptibility to corticosteroid-induced adrenal suppression: a genome-wide association study,The Lancet Respiratory Medicine,2018,第5作者(11)Skeletal Maturity Recognition Using a Fully Automated System With Convolutional Neural Networks,IEEE Access,2018,第4作者(12)Clinical predictors of active LN development in children - evidence from the UK JSLE Cohort Study,LUPUS,2018,第2作者(13)Clinical predictors of proteinuric remission following an LN flare - evidence from the UK JSLE cohort study,Pediatric Rheumatology,2018,第2作者(14)Investigating the prevalence, predictors and prognosis of suboptimal statin therapy early after a non-ST elevation acute coronary syndrome,Journal of Clinical Lipidology,2017,第2作者(15)TPMT, COMT and ACYP2 genetic variants in paediatric cancer patients with cisplatin-induced ototoxicity,Pharmacogenetics and Genomics,2017,第2作者(16)SNP-Treatment Interactions of Cardiovascular Medications and Risk of Acute Coronary Syndrome Recurrence,GENETIC EPIDEMIOLOGY,2016,第1作者(17)Pharmacogenetics on the time to acute coronary syndrome recurrence (PhACS): a UK cohort study,Hum Hered,2016,第1作者(18)A Genome-Wide two-Component Mixture Model Expectation-Maximization Algorithm for Time to Event Data,GENETIC EPIDEMIOLOGY,2016,第2作者(19)Study on the Optimal Mode of Foreign Investment Based on Simulated Annealing Algorithm,Journal of Computational and Theoretical Nanoscience,2016,第2作者(20)Pharmacogenetics of Acute Coronary Syndrome,GENETIC EPIDEMIOLOGY,2015,第1作者(21)Robust confidence intervals for trend estimation in meta-analysis with publication bias,Journal of Applied Statistics,2015,第2作者合作情况
长期与生物医学专家合作,IT与BT交叉融合。与蛋白质组学生物学家开展组学研究;与卫健委慢病防控,慢病科心血管医生等开展长期合作,进行疾病队列构建与数据挖掘,利用基因组等组学数据对疾病机制进行研究。
指导学生
已指导学生殷力硕士研究生085208-电子与通信工程
现指导学生
李婉莹硕士研究生085210-控制工程
胡奕绅硕士研究生085211-计算机技术
王东奇硕士研究生085211-计算机技术
宫长威硕士研究生081200-计算机科学与技术
黄华振硕士研究生085400-电子信息
荆常宏硕士研究生085400-电子信息
叶翔鹏硕士研究生085400-电子信息
王中昊硕士研究生085400-电子信息
2013 © 中国科学院大学,网络信息中心.