基于深度学习的特殊天体搜寻研究
作者单位:山东大学
学位级别:硕士
导师姓名:孔晓明
授予年度:2023年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 081104[工学-模式识别与智能系统] 08[工学] 070401[理学-天体物理] 0835[工学-软件工程] 0704[理学-天文学] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:热亚矮星是一种罕见的特殊天体,质量较低仅仅约为太阳质量的一半。热亚矮星的光谱型与主序星(O、B)相似,但亮度较低,光谱特征更宽。它们大多处于中心氦燃烧阶段,在赫罗图中位于水平分支星的最蓝端,因此也被称为极端水平分支星。热亚矮星被认为是椭圆星系核球紫外超的主要来源,对研究双星系统的相互作用和Ia型超新星前身星亦提供了关键信息。因此,搜寻热亚矮星以扩充已有的热亚矮星样本数量对银河系的结构和演化研究具有十分重要的意义。天体的光谱观测研究是天文研究的重要手段之一,光谱数据包含着丰富的天体物理学信息,例如大气参数、化学成分、质量、亮度等。目前,LAMOST光谱巡天项目的开展,为热亚矮星的搜寻提供了丰富的数据基础。但与此同时,海量光谱数据对传统的天文数据处理方法提出了挑战。目前,机器学习技术与方法已成功应用到多个领域,如何应用机器学习算法高效的处理光谱数据搜寻热亚矮星已经成为了一项重要的研究课题。针对海量天文光谱数据中热亚矮星的搜寻,本文主要进行了以下研究:(1)提出了一种高鲁棒性的热亚矮星分类方法。针对热亚矮星的光谱特点,结合特征融合的思想,构造了基于混合特征的Se-ResNet+SVM二分类模型,可以较高的准确率将热亚矮星从其他类天体中识别出来,测试集上模型的F1值达到了 96.17%。(2)考虑到BHB型星、B型星、A型星和热亚矮星的光谱相似性,我们针对第一步的判别结果进一步构造了 Se-ResNet+SVM四分类模型,对二分类模型搜寻出来的热亚矮星候选体进一步筛选,在测试集上F1值达到了 95.64%。(3)将训练好的两阶段分类模型应用到LAMOST DR8的333,534条低分光谱,二分类模型筛选出3266颗热亚矮星候选体,其中1223颗为新发现样本。随后,四级分类器对3266颗候选体进一步分类,当阈值为0.5和0.9时,分别有409颗和296颗恒星被判别为新发现的热亚矮星候选体。通过人工验证,我们确定了这三个候选体数据集中真正新发现的热亚矮星数量分别为176颗、63颗和41颗,精确率分别为67.94%、84.88%和87.60%。(4)基于Se-ResNet算法构建热亚矮星大气参数预测模型(Teff、log g、[He/H])。实验结果表明,模型在测试集上估测Teff、log g以及[He/H]时的MAE值分别为1212.65 K、0.32 dex和0.24 dex。随后,我们利用该模型预测了新证认的176颗热亚矮星大气参数值。此外,本文还对LAMOST低分光谱中钡巨星的搜寻工作进行了研究。钡巨星是宇宙中另一种特殊天体,对其研究可以更好地理解双星演化理论以及双星间的质量传递机制。本文针对钡巨星的判别模型建立进行了以下的工作:(1)通过不同输入特征对模型效果影响的对比实验,我们发现相较于吸收谱线作为输入特征,采用整条光谱作为特征时可以使模型具有更高的F1值。因此,我们选择了整条光谱作为模型的输入。此外,在实验过程中,我们还发现,针对不同元素增强的钡巨星需要采用不同的分类模型以最大限度地提高钡巨星分类效果。(2)针对Sr元素增丰的钡巨星,我们在Se-ResNet+SVM模型的基础上构建了 Se-ResNet+Stacking模型用于分类,该模型的F1值达到了 98.07%。(3)针对Ba元素增丰的钡巨星,我们进行了多种分类模型的试验,包括Se-ResNet+SVM、Se-ResNet+LGBM以及LGBM等。最终,我们选取了效果最好的LGBM模型作为分类模型,其F1值为96.87%。