随着数据挖掘技术的日益成熟,将其运用于材料科学研究已逐渐成为可能。这导致材料信息学这一新兴领域的出现。经过长时间的发展,大量的材料学术文献积累了丰富的科学成果,以文本形式散布在文献中的科学知识一般仍由研究人员手动收集和分析,这通常十分耗时且难以保证信息的完整度。如果将文献中的材料科学信息表示为结构化的知识,再结合知识关联、融合、推理等方法,构建材料知识图谱,可以使研究人员准确而又高效地获取信息,并对过往研究进行脉络梳理,对有潜力的材料进行剖析。材料知识图谱作为高效的知识管理载体,能够大规模地从海量材料科学文献中抽取信息,建立实体之间的对应关系,有助于阐明实体之间的内在关联,这将极大地促进我们对科学知识发展的宏观及全面理解。
基于此,北京大学深圳研究生院新材料学院潘锋教授课题组结合机器学习和依赖匹配算法,发展了一套高精度且高效的同名消歧以及信息搜索框架,在材料科学领域建立了主体(作者)与客体(材料)之间的对应关系(图1),构建了名为MatKG的材料知识图谱,并对锂离子电池正极材料LiFePO4进行自动化分析,生成其发展里程碑,追踪其研究趋势。知识图谱在材料科学中的应用将为材料研究领域提供一个高效的信息处理平台,MatKG可以提供自动化的材料科学领域的信息获取方式,有助于融合和完善各领域的材料科学知识。相关成果以“Construction and Application of Materials Knowledge Graph Based on Author Disambiguation: Revisiting the Evolution of LiFePO4”为题,近日发表在国际知名学术杂志《先进能源材料》(Advanced Energy Materials,DOI:10.1002/aenm.202003580,影响因子25)上。
图1.材料知识图谱的架构
知识图谱是由相互连接的实体以及相关的属性组成的,高精度地实体消歧(如何准确确定文章的作者)是准确构建知识图谱的前提,判断知识库中的同名实体(同名同姓是否是同一个人)是否代表不同的含义以及知识库中是否存在其他命名实体与之表示相同的含义是一项重要任务。在材料知识图谱中,作者的歧义化是知识库构建的主要障碍之一,同名以及相似姓名变体的作者经常会被混淆,常造成信息的搜索或关联错误。因此,基于作者信息以及文本信息,团队结合机器学习和依赖匹配算法对材料知识图谱中的主体(作者)进行高精度消歧,并引入剪枝策略以解决在面对庞大且复杂的数据时查找效率较低的问题,实现高效信息匹配和搜索,从而构建了MatKG的框架(图2)。
图2.MatKG的构建流程图
MatKG可以为不同领域的研究人员提供快速而客观的学术界趋势跟踪,研究团队以诺贝尔奖获得者Good enough教授锂电池正极材料LiFePO4为例,利用建立好的知识图谱框架,对其进行自动化分析,关联相关****及其研究信息,建立用于锂离子电池的LiFePO4的发展里程碑图(图3),发现其发展的重要历程。
图3.用于锂离子电池的LiFePO4的发展里程碑图
这项工作结合自然语言处理、机器学习等方法,系统地整理了科学出版物中的知识,从而可以有效提高科研人员精准获取信息的效率,有助于探索潜在的知识联系以及有效处理复杂多样的关联分析,并发现隐藏在数据和文本中的有价值的信息。该研究成果为材料科学研究带来了新的见解和启发。研究团队在未来将结合材料的更多特性信息构建基于MatKG的材料推理和预测系统,旨在为材料开发和设计开辟新的范式。
这项工作是在潘锋和李舜宁副研究员的共同指导下,由第一作者北京大学深圳研究生院新材料学院硕士研究生聂志伟及相关人员一起完成。该工作得到国家材料基因组重点研发计划、深圳市科技计划和化学与精细化工广东省实验室科研启动项目的大力支持。
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
深研院新材料学院潘锋课题组在构建材料知识图谱研究方面取得进展
本站小编 Free考研考试/2021-12-20
相关话题/材料 知识 信息 材料科学 文献
信息学院微纳电子学系在高端芯片领域取得重要进展
被誉为集成电路领域“国际奥林匹克盛会”的国际固态电路会议(InternationalSolid-StateCircuitsConference,ISSCC)受新冠病毒疫情影响于2021年2月13日至22日以线上会议形式举行,本次会议是该系列会议的第68届。信息科学技术学院微纳电子学系在“超低功耗智能 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20深研院新材料学院在富锂锰基正极材料的阴离子氧化还原机理研究方面取得进展
锂电池作为新一代绿色储能器件已经改变了我们的生活,正极材料仍然是电池储存容量、循环寿命以及成本的瓶颈,通常具有高工作电压以及超高的可逆比容量,是开发下一代高能量密度锂离子正极材料的研究重点之一。富锂锰基层状过渡金属氧化物(aLi2MnO3.bNMC)已经被广泛的应用为研究富锂材料的模型体系。关于Li ...北京大学通知公告 本站小编 Free考研考试 2021-12-20深研院化生学院杨世和课题组在卤化钙钛矿材料制备及其钙钛矿X射线探测器成像领域取得突破性进展
近日,深圳研究生院化学生物学与生物技术学院杨世和课题组在国际知名期刊Cell的姊妹刊Matter上,发表了题为“Anaerosol-liquid-solidprocessforthegeneralsynthesisofhalideperovskitethickfilmsfordirect-conve ...北京大学通知公告 本站小编 Free考研考试 2021-12-20深研院新材料学院潘锋组与化学院孙俊良组联合用3D电子衍射揭示高电压钴酸锂机理在Nature Nanotechnology发表
锂电池作为新一代绿色储能器件已经改变了我们的生活,使我们用上了手机等移动通信和电动车等绿色出行。目前正在使用锂电池正极材料可分为3类,高端手机等用的钴酸锂、电动车电池用的有层状高容量但安全性不高的镍钴锰三元氧化物和高安全但容量不高的磷酸铁锂、电动自行车和充电宝用的低容量低成本低循环稳定性的尖晶石锰酸 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20深研院新材料学院在锂电池无钴层状正极材料取得重大进展
随着汽车工业逐渐向电动化转移,高性能电池的需求将大大地增加。在过去的三十年,电池技术的革新已经取得了巨大的成功,能量密度大幅提升。当前,电动化时代面临的主要挑战是电池高昂的成本。电池的成本问题主要与急速增加的原料价格有关,其中尤其是作为主要成分的钴。近年来,由于主要产地的政治动荡,人权道德等问题严峻 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20新材料学院基于材料基因大数据研发的“未名材料解析系统”投入应用服务
“一代材料、一代产业”,材料研制周期长、检测分析困难等问题一直限制着新材料的研发与应用。2016年国家启动了材料基因工程重点研发计划目的是用新的研究范式(高通量计算、高通量制备、高通量检测及构建材料数据库)加速新材料研发速度。北京大学深圳研究生院新材料学院潘锋教授于2016年联合多所高校、研究机构和 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20信息学院周小计课题组和合作者发现三重向列序量子超流体
自然界中除了液体和固体等常规的物质状态以外,还存在介于两者之间的液晶态。液体具有各向同性和空间平移不变性的特征,这两种对称性在液体发生固态相变之后同时失去,而液晶可以形成向列序,即在保持平移不变性的情况下失去各向同性。据此类比,超流体和超固体这两种量子物质状态之间也存在一种超流版本的液晶态。超流体仅 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20深研院新材料学院在锂离子电池正极材料的极化子现象相关机理研究方面取得系统性进展
作为一种高能量密度储能器件,锂离子电池不仅已经广泛应用于消费电子领域(如笔记本电脑、智能手机),而且也适合用于电动车中的动力电池。正极是锂电池最为重要的组成部分。在正极材料的研究中,当电子在空间上局域分布并与晶格耦合将形成极化子,极化子现象近些年逐渐引起人们更多关注,主要是因为其减弱电子导电性,不利 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20新材料学院有机光电团队在《自然·通讯》发文展示首个由三相交流电直接驱动的电致发光器件
柔性电子近年来引起了全世界的研究热潮,其中电致发光器件在柔性电子中具有广泛的应用。然而目前的电致发光器件大多功能单一,封闭的器件结构导致很难集成传感功能以满足物联网时代对发光器件智能性的要求。除此之外,电致发光器件大多采用直流电或单相交流电驱动,这样的器件接入到三相电网中需要复杂的后端电路,额外消耗 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20新材料学院潘锋课题组对低成本电池正极材料MnO2的研究与发展进行总结展望
近年来,MnO2由于成本低廉、高理论容量等优点被作为多种离子电池正极宿主材料而广泛研究,包括应用在Li+、Na+、K+、Zn2+、Mg2+等正极材料,但MnO2材料低的电子/离子电导率、低的可逆放电容量、缓慢的扩散动力学和较差的循环稳定性,限制了其产业化应用潜力。为解决这些问题,研究人员提出了多种性 ...北京大学通知公告 本站小编 Free考研考试 2021-12-20