近日,上海交通大学生命科学技术学院微生物代谢国家重点实验室在生物信息学顶级刊物《Briefings in Bioinformatics》(IF:11.622)上发表题为“T4SEfinder: a bioinformatics tool for genome-scale prediction of bacterial type IV secreted effectors using pre-trained protein language model”的研究论文。该文将人工智能方法应用于细菌IV型分泌系统效应蛋白预测的场景,提供了一款新的、适用于细菌全基因组规模的预测软件。生命科学技术学院硕士生张昱朦和张阳明为该论文的并列第一作者,生命科学技术学院欧竑宇教授和澳大利亚莫纳什大学生物医学发现研究所宋江宁副教授为该论文的共同通讯作者。
细菌IV型分泌系统分泌系统(type IV secretion system, T4SS)是由多个蛋白组件构成的跨膜装置,不仅能够介导DNA接合转移,还能将效应蛋白精准转运到真核或原核细胞中。IV型分泌系统效应蛋白(T4SE)能够影响真核细胞的基因表达和信号转导,在病原细菌致病过程中起到重要作用。前期工作中,欧竑宇研究组构建了T4SS开放数据库SecReT4,通过文本挖掘和人工校正,系统地收录了实验验证的IV型分泌系统基因簇和效应蛋白等高质量数据(Bi, et al.,Nucleic Acids Research, 2013)。预测效应蛋白最简便的方法是与SecReT4收录的T4SEs进行序列比对;而人工智能方法则有可能发现与已知T4SE序列相似性低的新效应蛋白。近期,卷积神经网络(CNN)等多种机器学习方法开始应用于T4SE和non-T4SE的分类问题,然而它们的预测精度和运行速度仍有待提高。
细菌IV型分泌系统效应蛋白预测软件T4SEfinder的模型架构
TAPEBert_MLP主体结构由蛋白序列预训练语言模型(TAPEBert)和多层感知机分类器(MLP)组成
该论文将蛋白序列预训练语言模型(pre-trained protein language model)TAPEBert应用到T4SE分类任务中,开发了快速准确的T4SE预测软件T4SEfinder。首先,通过更新SecReT4数据库,T4SEfinder的训练集包含了来自21种细菌的518个经实验验证的T4SEs。其次,通过综合评估多种机器学习模型对T4SE的预测性能后,T4SEfinder采用了基于BERT的蛋白序列预训练方法TAPE(Task Assessing Protein Embeddings)以及多层感知机分类器(multi-layer perceptron,MLP)来搭建模型TAPEBert_MLP(上图);对于五折交叉验证和独立测试数据集,TAPEBert_MLP模型的预测准确率略优于常用的基于PSSM(位置特异性打分矩阵)和CNN的PSSM_CNN模型。最后,部署在一台RTX 2080 SUPERGPU服务器上的T4SEfinder能够在3分钟内完成5000条蛋白序列中T4SE和non-T4SE的分类,速度比PSSM_CNN方法快五十多倍。因此,T4SEfinder适用于细菌全基因组规模的T4SE识别问题,可能有助于实验发现病原菌的新效应蛋白。
论文链接:https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab420/6397152?login=true
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
上海交大欧竑宇研究组开发细菌全基因组规模预测IV型分泌系统效应蛋白的新软件
本站小编 Free考研考试/2022-02-12
相关话题/系统 序列 论文 实验 软件
上海交大生命科学技术学院、系统生物医学研究院团队发现Pyk2抑制场景恐惧记忆的新机制
2021年9月17日,上海交通大学吴强团队在JournalofMolecularCellBiology(JMCB)上发表了题为"Pyk2suppressescontextualfearmemoryinanautophosphorylation-independentmanner"的研究成果,发现Py ...上海交通大学通知公告 本站小编 Free考研考试 2022-02-12上海交大陈东尧团队在网络系统领域顶会中发表研究成果
近日,上海交通大学电子信息与电气工程学院约翰·霍普克罗夫特计算机科学中心在计算机网络领域物联网方向取得突破性进展,研究成果MagX:Wearable,UntetheredHandsTrackingwithPassiveMagnets(MagX:基于永磁铁的可穿戴、无束缚的手部跟踪技术)被网络系统领域 ...上海交通大学通知公告 本站小编 Free考研考试 2022-02-12李政道研究所在国际顶级期刊发表关于大动量有效理论的综述论文
近日,国际顶级学术期刊《现代物理评论》(ReviewsofModernPhysics)发表了季向东、刘乙庄、刘于圣等****以李政道研究所署名的题为Large-MomentumEffectiveTheory(大动量有效理论,简称LaMET)的综述性论文(Rev.Mod.Phys.93(2021)03 ...上海交通大学通知公告 本站小编 Free考研考试 2022-02-12从横场伊辛链到量子E8可积模型: 李政道研究所吴建达团队在一维量子可积系统的研究中取得重要进展
近日,上海交通大学李政道研究所李政道****吴建达的理论团队,中国人民大学于伟强教授核磁共振实验团队与上海交通大学物理与天文学院的马杰教授中子散射实验团队共同合作,在国际权威物理学期刊《物理评论快报》上,以“E8SpectraofQuasi-one-dimensionalAntiferromagne ...上海交通大学通知公告 本站小编 Free考研考试 2022-02-12上海交大生科院iGEM软件队发表多表型全基因组关联分析方法研究成果
近日,上海交通大学生命科学技术学院生物信息学与生物统计学系、上海交大-耶鲁生物统计与数据科学联合中心团队在《BriefingsinBioinformatics》(IF:11.622)上发表题为“GESLMalgorithmfordetectingcausalSNPsinGWASwithmultipl ...上海交通大学通知公告 本站小编 Free考研考试 2022-02-12李万万研究员团队在《Advanced Materials》发表体外诊断领域功能微纳米材料研究综述论文
多因子生物检测,即在复杂生物样本中同时检测一系列目标物,对于分析生物反应和过程、疾病诊断等方面都比单因子检测有着明显的优势,并对人类健康问题和生命科学的发展有着重要意义。而针对目前多因子检测领域还存在的一些关键性的问题,例如如何增加可分辨的信号数量用于待测物编码、如何提高整个体系的检测性能以满足所有 ...上海交通大学通知公告 本站小编 Free考研考试 2022-02-12上海交大系统生物医学研究院张延团队和严威团队合作开发质谱检测新策略深度解析阿尔兹海默症相关糖蛋白APP的糖基化
阿尔兹海默症(Alzheimer’sdiseases,AD)是最常见的一种神经退行性疾病,临床表现为渐进性记忆损伤,认知功能障碍,语言障碍等精神症状。我国现有1000多万AD患者,是世界上患者数量最多的国家。且随着人口老龄化,这个数字还在急剧增加,据预测到2050年中国AD患病人数将超过4000万, ...上海交通大学通知公告 本站小编 Free考研考试 2022-02-12上海交大海洋学院曹玲关于海洋水产品未来前景的研究成果入选ESI高被引论文和热点论文
近日,据WebofScience的“基本科学指标数据库(EssentialScienceIndicators,简称ESI)”2021年5月和7月更新数据显示,我院曹玲老师以共同通讯作者在国际顶级期刊《Nature》发表的研究论文“Thefutureoffoodfromthesea”入选ESI高被引论 ...上海交通大学通知公告 本站小编 Free考研考试 2022-02-12上海交大ITEWA团队在Cell Reports Physical Science期刊发表“胺嫁接层状双金属氢氧化物用于直接空气捕集二氧化碳”研究论文
近日,CellPress期刊CellReportsPhysicalScience发表了有关直接空气捕集二氧化碳研究成果Modifiedlayereddoublehydroxidesforefficientandreversiblecarbondioxidecapturefromair,论文由上海交大 ...上海交通大学通知公告 本站小编 Free考研考试 2022-02-12上海交大“生物质热化学转化”创新工作室发表有关主曲线法的论文
近日,上海交大农生学院资环系本科生罗来鹏同学在热力学领域顶尖期刊《Energy》(中科院分区一区期刊,影响因子6.082)上发表题为“Insightintomasterplotsmethodforkineticanalysisoflignocellulosicbiomasspyrolysis”的研究 ...上海交通大学通知公告 本站小编 Free考研考试 2022-02-12