云南天文台在空间目标的测光图像污染分类方面获进展

近日,中国科学院云南天文台应用天文研究团组在空间目标的测光图像污染分类方面获进展,建立、训练并检验了机器学习模型对被恒星污染、云层污染的图像进行检测分类。该结果以题为“Machine Learning-Based Identification of Contaminated Images in Light Curves Data Preprocessing”在期刊RAA上发表。

通过统计分析,污染情况可以分为两大类:第一种是因为附近恒星经过导致目标物体亮度显著增加,称为“恒星污染”;第二种是因为云层遮挡导致亮度明显下降,称为“云层污染”。传统上采用人工检查图像耗时又费力。我们提出利用机器学习方法对图像进行分类。卷积神经网络(CNN)和支持向量机(SVM)被分别用于检测恒星污染和云层污染,在测试集上F1分数分别达到了1.000.98

科研人员通过人工标注云南天文台1.2m望远镜2022-2023年部分观测数据,作为用于机器学习训练的数据集。他们发现,对于识别恒星污染:使用stamp图像训练的CNN模型在识别恒星污染方面表现出更高的准确率;对于识别云层污染:ResNet-18在训练集和测试集上的准确性均较低;lightGBM模型泛化性能较差,需要长期积累数据才能克服这一问题;SVM模型具有较强的泛化能力,对新样本的分类准确率保持在97.12%的高水平。

该工作得到国家自然科学基金面上项目、中国科学院“西部之光”、云南省“兴滇英才支持计划”资助。

论文链接


附件下载: