清华新闻网10月4日电 近日,清华大学交叉信息研究院曾坚阳课题组成功开发了一个基于序列的多尺度预测多肽和蛋白质相互作用的深度学习模型。该研究为多肽和蛋白质相互作用的机制提供了一个高效的预测框架,可以在为多肽药物预测结合靶点的同时,识别多肽序列上的结合位点。
多肽和蛋白质的相互作用在生物体内起到关键的作用,参与多种细胞过程,比如信号传导、基因表达调控、细胞增殖和凋亡。识别和解析多肽和蛋白质的相互作用及其机制,有助于为多肽药物精准定位靶点,并为多肽药物的化学修饰提供信息,从而加速多肽药物的研发进程。
目前主流的计算框架分别基于序列的和基于结构来识别蛋白质和多肽配体的相互作用。然而,这些方法主要集中于识别蛋白质表面与多肽结合结合的残基,无法直接提取多肽序列中的结合残基。此外,基于结构的方法需要用到三维结构信息,但通过传统的实验方法测定得到的蛋白质-多肽复合物的结构非常昂贵且耗时。在本项研究中,作者提出了名为CAMP的深度学习框架,用于同时预测多肽-蛋白相互作用(PepPIs)和识别多肽序列上的结合残基。
CAMP的模型框架图
CAMP将蛋白质和多肽的氨基酸序列、二级结构、理化性质、序列灵活性得分和蛋白质的PSSM矩阵作为模型输入,利用卷积神经网络(CNN)模块和自注意力机制(self-attention)来预测给定的肽-蛋白对之间是否存在相互作用,同时识别多肽序列上的结合位点。
实验结果表明,在多种数据划分的设定下,CAMP在基准数据集上的表现均优于现有的方法。此外,测试结果和案例分析表明,CAMP可以准确地预测多肽序列上的结合残基,从而为进一步理解多肽与蛋白质的结合机制提供有效的帮助。最后,作者进一步研究了CAMP在三个相关任务中的应用潜力,即多肽-蛋白结合域相互作用预测(peptide-PBDinteraction)、结合亲和力评估和多肽的虚拟筛选。结果表明,CAMP在这三个相关任务上均获得出色表现。
综上所述,作者开发了一个多层次的多肽-蛋白相互作用预测的深度学习框架(CAMP)以同时预测多肽和蛋白质之间时候存在相互作用和识别多肽序列的结合残基。该方法使用多通道特征提取器分别处理数值特征和分类特征,以避免多源特征的不一致性。此外,作者通过和现有的最有方法比较,验证了CAMP拥有更优的性能,同时展示了CAMP在peptide-PBD相互作用预测、多肽-蛋白质的亲和力评估和多肽的虚拟筛选方面的应用潜力。这些结果表明,CAMP可以提供准确的肽-蛋白相互作用预测,并有助于研究者理解多肽与蛋白质结合的潜在机制。
相关成果《一个多层次多肽-蛋白相互作用预测的深度学习框架》(A deep-learning framework for multi-level peptide–protein interaction prediction)于9月15日在《自然·通讯》(Nature Communications)上发表。论文通讯作者为清华大学交叉信息研究院曾坚阳副教授和赵诞助理研究员,第一作者为清华大学交叉信息研究院2022级拟入学博士生雷逸品,合作作者包括清华大学自动化系李梢课题组等。此项研究工作获得国家自然科学基金和南京图灵人工智能研究院支持。
论文链接:
https://www.nature.com/articles/s41467-021-25772-4
供稿:交叉信息研究院
编辑:李华山
审核:吕婷
2021年10月04日 08:29:51
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
交叉信息研究院曾坚阳课题组成功开发多肽和蛋白质相互作用的深度学习模型
本站小编 Free考研考试/2021-12-20
相关话题/序列 信息 结构 药物 清华大学
交叉信息研究院段路明研究组首次实现多离子协同激光冷却
清华新闻网10月4日电近日,清华大学交叉信息研究院段路明研究组在离子阱量子信息处理领域取得重要进展,通过对优化选择的少量离子进行激光冷却,首次实现对长离子链的高效协同冷却,获得接近全局激光冷却的极限温度,为多离子比特量子计算准备了技术基础。离子阱体系是目前实现量子计算、量子模拟的主要技术路线之一。当 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20清华大学代表队获欧洲大学生载重飞机挑战赛亚军
清华大学代表队获欧洲大学生载重飞机挑战赛亚军 清华新闻网8月26日电8月12日,在葡萄牙里斯本举行的2013年欧洲大学生载重飞机挑战赛中,由清华大学航天航空院学生航空创新实践基地(AIR)学生组成的清华大学代表队经过3个比赛日的激烈角逐,最终斩获亚军,并在载重量和装载速度两个重要单项上拔得头筹。图 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20清华大学领衔揭示早期宇宙星际间重元素起源之谜
清华新闻网9月28日电清华大学天文系通过毫米波阵列观测发现,宇宙早期星际间中的重元素,可能起源于一亿个太阳光度的巨大星系的反馈作用,这一发现挑战了国际上现有的星系形成理论。星际间介质中的重元素存在之谜在宇宙中,绝大部分物质不在星系里,而在星系之间。这部分弥散在星系之间广袤空间里的物质,被称为星际间介 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20清华大学-中国长江三峡集团有限公司气候变化治理机制与绿色低碳转型战略联合研究中心揭牌成立
清华新闻网9月23日电(实习记者欧阳承希摄影石加东)9月22日下午,清华大学-中国长江三峡集团有限公司气候变化治理机制与绿色低碳转型战略联合研究中心(以下简称“联合研究中心”)揭牌仪式在工字厅东厅举行。清华大学党委书记陈旭,校党委常务副书记姜胜耀,中国长江三峡集团有限公司董事长、党组书记雷鸣山,副总 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20清华大学牵头的国际电工委员会新能源建模领域首个国际标准成功立项
清华新闻网9月23日电近日,从国际电工委员会(IEC)获悉,由清华大学牵头,华能江苏公司、中国电科院、北京创拓标准研究院参与发起的国际电工委员会(IEC)国际标准“用于电力系统动态分析的基于变流器发电单元的通用均方根值(RMS)仿真模型”(IECTS63406ED1GenericRMSsimulat ...清华大学通知公告 本站小编 Free考研考试 2021-12-20清华土水学院与广联达软件共建建筑信息模型中心
清华土水学院与广联达软件共建建筑信息模型联合研究中心 清华新闻网9月25日电(记者范丽)9月25日上午,清华大学(土水学院)广联达软件股份有限公司建筑信息模型(BIM)联合研究中心揭牌仪式在京举行。清华大学副校长袁驷、广联达软件股份有限公司董事长刁志中出席仪式并共同为BIM研究中心 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20交叉信息研究院曾坚阳研究组合作提出深度学习建模基因调控网络新算法
清华新闻网9月13日电近日,清华大学交叉信息研究院的曾坚阳研究组与北京大学马剑竹课题组、索尔克生物研究所、加利福尼亚大学、上海交通大学合作,首次将基因调控网络显式的引入单细胞RNA测序(scRNA-seq)数据建模中,其效果在调控网络预测、scRNA-seq数据低维嵌入、scRNA-seq数据模拟生 ...清华大学通知公告 本站小编 Free考研考试 2021-12-202013清华大学水上环境论坛举行
2013清华大学水上环境论坛举行清华新闻网10月14日电日前,由清华大学美术学院主办的2013清华大学水上环境论坛在美术学院举办。作为2013北京国家设计周的活动之一,论坛吸引了来自全国的****,与会专家就广义水上环境的相关议题进行了论述和研 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20清华大学深圳国际研究生院学生团队荣获第十届全国海洋航行器大赛特等奖
清华新闻网9月2日电8月28日,第十届全国海洋航行器设计与制作大赛决赛在上海交通大学拉开帷幕。本次比赛由中国科协与工信部指导,中国船舶集团有限公司、中国造船工程学会、国际船舶与海洋工程创新与合作组织等单位联合主办,上海交通大学等单位承办。清华大学深圳国际研究生院学生团队(海洋工程研究院研究生王凯甬、 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20生命学院魏迪明课题组开发实现DNA纳米结构动态转换的新方法
清华新闻网8月30日电DNA自组装形成的复杂纳米结构和装置作为合成生物学元件,能够在生命科学、化学、材料学等领域中提供微纳米技术解决方案。在DNA纳米技术领域中,有许多方法能够实现DNA纳米结构的动态变构,包括调节环境因素实现不同DNA结构状态的转换、利用酶对DNA分子的作用实现结构变换,以及经典的 ...清华大学通知公告 本站小编 Free考研考试 2021-12-20