双峰发射线轮廓光谱对星系并合过程、星系对的相互作用、活动星系核的喷流等诸多活动现象的深入研究具有重要作用,目前已证认的这类光谱样本非常稀少。LAMOST发布数据中已有超过20万条河外星系光谱数据,这为发现并搜寻此类天体提供了宝贵的数据支持,但是实测光谱呈现的双峰轮廓形状各异、强弱不同、受噪声干扰情况也不同,甚至在哪些发射线上呈现都各不相同。这些复杂多样的特征极大地增加了从海量数据中搜寻双峰发射线轮廓光谱的难度,因此目前主要的方法仍然依赖于繁重的人眼检查。
屈彩霞等人引入数据挖掘以及机器学习中相关子空间、支持向量机(SVM)、概念格等先进技术,通过分析LAMOST光谱中呈现的双峰发射线轮廓的特点,设计了双峰轮廓的识别与评估技术框架(SVM-LATTICE)。该技术框架在保证完备性的前提下,可以实现50%以上的双峰轮廓自动化识别,大幅减少了人眼检查工作;随着光谱数据量的增长,该技术框架具有比传统模板匹配方法更快的自动搜寻速度,同时可以为物理分析提供统计学依据。

双峰发射线轮廓光谱及对应测光图像伪彩图示例

SVM-LATTICE框架示意图:图中每个结点都部署一个分类器,对应一个特征空间集,结点间构成一个双峰轮廓的置信Grid,纵向上较低的层次拥有较高的置信度,由高到低满足置信阈值可以实现搜寻短路;横向上反映不同的特征类别,有利于区分可能的特征激发机制。此外,层次间结点体现了特征在统计上的泛化-例化关系。
相关论文链接:
[1] https://ieeexplore.ieee.org/abstract/document/8756202
[2] https://ieeexplore.ieee.org/document/9079538