机器学习在各领域的广泛应用促生其在材料领域的应用,它提供了一种新型的工具,即能从高维数据中发现数据间的规律,有助于减少计算量从而加速对新材料的探索。特征提取(特征工程)是机器学习的关键组成部分,选择合适的形式来表达将直接影响最终模型的效果。在材料科学领域必须要捕获所有的相关信息,从而达到区分不同原子和不同晶体环境的作用。因此在材料领域中,特征可以是简单的确定原子序数,可能涉及复杂的转换,比如径向分布函数(RDFs)的扩展,也可能是聚合统计数据(例如求平均值、求最大值等)。
在数学中,拓扑可以用来处理空间中不同组件的连通性,并表征空间中独立的实体,环和高维拓扑面。拓扑提供了最高级别的抽象因此可以作为一种处理高维结构数据的有效工具。其中,拓扑数学的持续同调(persistent homology)通过将多尺度几何信息嵌入拓扑不变量从而将几何分析和拓扑分析连接起来,它是一种在变化的尺度中分析拓扑结构的重要方法。其基本思想是随着原子尺度的变化记录结构的拓扑不变量(例如β0、β1 和β2),从而得到拓扑指纹(如图1所示)。
图1 类苯环结构的拓扑指纹示意图及碳硼烷结构的预测
在此过程中,利用持续时间较长的拓扑特征来表征系统的内在特性,通过预先设定的阈值进行过滤。在三维空间中,独立组成、环和腔是非常重要的拓扑特征。具有一定连接关系的结构会产生内在不变的拓扑特征。持续同调可以记录原子尺寸变化过程中,系统拓扑不变量的开始和结束,通过条形码(barcode)可以进一步将其可视化,也称为拓扑指纹。
北京大学深圳研究生院新材料学院潘锋教授课题组与美国密歇根州立大学数学系魏国卫教授课题组合作,首次将以持续同调为基础的数学方法引入材料科学中,利用持久同源将高维空间中的材料结构映射到低维拓扑空间,从而更方便地研究结构与性能之间的关系。研究团队将持续同调方法引入碳硼烷体系的分析,通过对这些结构的拓扑指纹的分析,建立起基于拓扑不变量及其持久长度的模型。他们利用拓扑不变量(β0、β1和β2)定量分析和预测了碳硼烷结构及其对应BnHn2-的相对能量。通过利用拓扑不变量(β0、β1和β2)的平局长度特征,可以将该拓扑信息与BnHn2- (n = 5~20)的相对能量进行精确拟合,Pearson相关系数为0.977,而相应的碳硼烷结构C2Bn - 2Hn (n = 5~20)的Pearson相关系数为0.937,如图1。该工作以令人满意的精度证明了持续同调方法应用于多原子体系的可行性,提供了一种新型的团簇结构描述符(Chinese J. Struct. Chem.2020, 39(6), 999-1008)。在未来的工作中,研究团队将利用更有效的机器学习方法,根据持续同源得到的拓扑信息,建立结构与性质之间的关系,实现更大原子数量的碳硼烷结构的预测。
同时,团队在锂团簇能量预测方面,除了使用拓扑不变量来提取团簇结构的拓扑几何信息,对于原子间的短程作用和长程作用等数据信息,还进一步提出了持续独立原子对(PPI)来计算“生长”过程中每对原子(或点)的独立性。最初,所有的原子都是不相连的,PPI条的数目等于独立原子对的数目。随着生长?参数的变大,一些原子对连接起来,它们的PPI合并。他们提出的PPI条码比β0更具信息量。如图2所示,其可以与拓扑不变量一起用于描述材料结构。基于提取的拓扑特征,研究团队构建团簇能量预测机器学习模型。最终,他们仅仅利用小型团簇结构构成的数据集来训练所得的模型,即可对中型和大型团簇形成非常高的预测精度。该模型可用于团簇结构的快速筛选,加快最稳定团簇结构搜索的速度。相关成果发表在隶属Nature Index的知名杂志The journal of physical chemistry letters(2020, 11, 4392)上。
图2 基于持续同调与持续独立原子对的锂团簇能量预测
在无机材料的能量预测方面,由于持续同调仅提供全局的拓扑结构信息,对于无机化合物包含大量不同元素和不同结构的体系没法直接使用。因此,团队提出了原子特殊的持续同调(ASPH),它考虑的是晶胞中每个原子周围不同环境构成的持续同调,在拓扑不变量中嵌入原子信息。基于ASPH方法表达的结晶化合物拓扑特征可以构建晶体能量预测模型,使用拓扑表达的结构特征配合元素特征可以实现MAE仅为61 meV/atom的结果(图3)。此外,基于预测结果,团队还对预测偏差较大的结构进行了详细的讨论与分析,发现了异常通常存在于特殊的氧化态与畸变的结构之中,增加了此类异常的认识与理解。相关成果最近发表在Nature集团旗下的知名杂志npj Computational Materials(2021,7, 1-8)上。
拓扑数学是一个强大的工具,可以通过变化的尺度定性分析数据结构,借助机器学习方法,便可以构造有高精度的材料预测机器学习模型,用于团簇结构分析、团簇结构搜索以及晶体结构能量预测等诸多材料结构规律的科学研究中,有助于加速材料的发现与应用。
该工作由潘锋和魏国卫共同指导,第一作者分别是北京大学深圳研究生院新材料学院研究生陈冬、陈鑫和江毅,他们与团队成员协作共同完成这项研究。该工作得到国家材料基因组重点研发计划和深圳市科技计划项目的大力支持。
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
新材料学院潘锋课题组在基于拓扑数学与机器学习研究材料结构规律上取得进展
本站小编 Free考研考试/2021-12-20
相关话题/结构 材料 信息 空间 数据
物理学院量子材料科学中心刘雄军课题组及合作者基于超冷原子首次实现最基本的外尔拓扑能带
近日,北京大学物理学院量子材料科学中心刘雄军教授课题组与中国科学技术大学潘建伟院士、陈帅教授等合作,在超冷原子模拟拓扑量子材料方面取得重要进展。联合研究团队基于刘雄军课题组此前提出的理论模型,在国际上首次利用超冷原子体系实现了三维人工自旋轨道耦合,并构造出仅有一对外尔点的最基本外尔半金属(Weyls ...北京大学通知公告 本站小编 Free考研考试 2021-12-20李辰旭:构建由数据驱动的金融衍生品定价模型
从沪深300股指期货鸣锣上市到探索各类股指ETF期权、股票期权、利率期权,10余年间,金融衍生品已深深嵌入我国资本市场肌理,并与广大投资者利益密切相关。大数据时代,如何让金融衍生品的定价更科学、更有效,从而助力交易决策和风险管理的重大需求?北京大学光华管理学院商务统计与经济计量系副教授李辰旭通过理论 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20《物理评论快报》报道量子材料科学中心谢心澄研究组及合作者关于轴子绝缘体无序下相变及其独特临界行为的研究
最近,北京大学物理学院量子材料科学中心谢心澄院士研究组与苏州大学物理科学与技术学院江华、陈垂针教授合作,对三维轴子绝缘体中无序诱导的相变和临界行为展开研究。他们发现了一种二维量子霍尔效应的相变普适类,并提出可以利用该相变在三维磁性拓扑绝缘体中探测轴子绝缘体态。2021年4月12日,该项工作以“轴子绝 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20物理学院量子材料科学中心王楠林课题组及其合作者利用超快激光在Ta2NiSe5中诱发多级以及稳定相变
量子物态调控是当今凝聚态物质科学的主要研究前沿之一,对信息科学技术的发展具有潜在的重大影响。对于复杂量子材料系统,由于其内部存在多种自由度的耦合,它们的竞争或合作会导致材料形成不同的量子涨落或量子有序态(如超导、磁性、密度波等)。通常人们通过改变温度、压力、磁场等手段可实现对其量子物态或性质的调控。 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20物理学院量子材料科学中心高鹏课题组与合作者在非极性材料中设计产生了纳米尺寸的极性拓扑反涡旋
寻找新颖拓扑结构并探索其物性是当前凝聚态物理研究的一个重点。这些拓扑结构有望为后摩尔时代电子学及其器件提供原材料。目前,人们对磁性材料中具有拓扑稳定性的实空间自旋结构,如涡旋、斯格明子、半子等,已经开展了广泛的研究。对于介电材料体系,偶极子也能在晶格自由度和电荷自由度的共同调控下发生旋转,形成拓扑稳 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20深研院新材料学院潘锋课题组在构建材料知识图谱研究方面取得进展
随着数据挖掘技术的日益成熟,将其运用于材料科学研究已逐渐成为可能。这导致材料信息学这一新兴领域的出现。经过长时间的发展,大量的材料学术文献积累了丰富的科学成果,以文本形式散布在文献中的科学知识一般仍由研究人员手动收集和分析,这通常十分耗时且难以保证信息的完整度。如果将文献中的材料科学信息表示为结构化 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20信息学院微纳电子学系在高端芯片领域取得重要进展
被誉为集成电路领域“国际奥林匹克盛会”的国际固态电路会议(InternationalSolid-StateCircuitsConference,ISSCC)受新冠病毒疫情影响于2021年2月13日至22日以线上会议形式举行,本次会议是该系列会议的第68届。信息科学技术学院微纳电子学系在“超低功耗智能 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20深研院化生学院杨震课题组利用可见光催化形式[2+2]/retro-Mannich反应构建cyclohepta[b]indole结构
近日,深圳研究生院化学生物学与生物技术学院杨震课题组在《德国应用化学》发表通讯论文,报道了可见光催化形式[2+2]/retro-Mannich反应构建cyclohepta[b]indole结构的研究工作。全碳季碳手性中心普遍存在于复杂天然产物和功能分子,具有重要的结构和功能意义。立体选择性构筑高空间 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20分子所陈雷研究组揭示人源TRPC5通道被不同小分子所抑制的结构基础
TRPC5是受体激活的非选择性阳离子通道,属于瞬时受体电位通道(TRP)家族中的经典型亚家族(TRPC)1。TRPC5通道的激活将引起细胞膜去极化和胞质内钙浓度上升。TRPC5通道主要表达于脑组织,在肝脏、肾脏等器官中也有一定程度的分布2-4。TRPC5介导多种生理过程,与恐惧、焦虑、抑郁等情绪的产 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20深研院新材料学院在富锂锰基正极材料的阴离子氧化还原机理研究方面取得进展
锂电池作为新一代绿色储能器件已经改变了我们的生活,正极材料仍然是电池储存容量、循环寿命以及成本的瓶颈,通常具有高工作电压以及超高的可逆比容量,是开发下一代高能量密度锂离子正极材料的研究重点之一。富锂锰基层状过渡金属氧化物(aLi2MnO3.bNMC)已经被广泛的应用为研究富锂材料的模型体系。关于Li ...北京大学通知公告 本站小编 Free考研考试 2021-12-20