
图1 人工试错与人工智能预测手性分子色谱分离条件的对比
北京大学材料科学与工程学院莫凡洋副教授课题组采用机器学习技术来预测手性分子在高效液相色谱中的保留时间,并提出分离概率这一指标以辅助预测色谱手性分离条件。为了解决数据采集的问题,研究者从644篇不对称催化文献中自动提取实验结果,建立了手性分子保留时间数据集(CMRT数据集)。同时,研究者提出一种分位数几何增强图神经网络(QGeoGNN),用于学习分子结构与保留时间的关系。为了拓展模型的实用性,色谱的领域知识被融入到机器学习模型中,实现了多柱预测。在此基础上,研究者进一步提出了分离概率指标,以衡量手性分子在给定条件下的分离概率,从而快速准确地预测最优的手性分离实验条件。

图2 色谱对映体分离预测模型实施路径
研究表明,该研究框架在保留时间预测和色谱分离条件预测方面表现良好,为机器学习技术在化学实验场景中的应用带来了新的视角。同时,它还提高了实验的效率,更有利于加快科学发现的速度。
相关研究成果发表于Nature Communications(Doi: 10.1038/s41467-023-38853-3),莫凡洋和张东晓教授(北京大学工学院,宁波东方理工大学)为本论文的共同通讯作者。北京大学博士生徐浩是本论文的第一作者,北京大学博士生林京龙是本文的第二作者。该项研究工作得到了国家自然科学基金的资助。
论文链接:https://doi.org/10.1038/s41467-023-38853-3