随着大型的来自不同波段的巡天望远镜的运行和发展,海量的不同波段数据成批涌现。如何将这些数据存储、管理、分析、融合、应用和挖掘等都是天文学家需要迫切解决的课题。为此我们开发了星表自动入库工具和交叉证认工具,及将二者融合起来的海量天文星表融合系统。借助该系统我们获得了来自不同星表的多波段数据。在这些数据上探讨了特征选择算法、分类、聚类和回归算法。对比了一些算法的性能,了解了各种算法的优缺点以及其适用的范围和条件。对于性能较好的算法,用于为郭守敬望远镜(LAMOST)选取类星体候选体。另外,从射电巡天星表(FIRST和NVSS)选取了未证认的源作为LAMOST的输入星表。这些工具和方法的成功应用将有助于天文学家处理和分析数据,发现知识,以此来带动天文理论和技术的发展和完善,这不仅对虚拟天文台的发展和完善有着重要的科学意义,而且对大型巡天项目LAMOST的输入星表和光谱处理有着非常重要的实用价值。
英文主题词data mining; data analysis; survey; quasars