位置:成果数据库 > 期刊 > 期刊详情页
一种基于Map/Reduce分布式计算的恒星光谱分类方法
  • ISSN号:1000-0593
  • 期刊名称:《光谱学与光谱分析》
  • 时间:0
  • 分类:P145.4[天文地球—天体物理;天文地球—天文学]
  • 作者机构:[1]山东大学威海机电与信息工程学院,山东威海264209, [2]中国科学院光学天文重点实验室,国家天文台,北京100012, [3]烟台大学计算机与控制工程学院,山东烟台264005
  • 相关基金:国家自然科学基金项目(U1431102,11473019)资助
中文摘要:

天体光谱中蕴含着非常丰富的天体物理信息,通过对光谱的分析,可以得到天体的物理信息、化学成分以及天体的大气参数等。随着LAMOST和SDSS等大规模巡天望远镜的实施,将会产生海量的光谱数据,尤其是LAMOST正式运行后,每个观测夜产生大约2~4万条光谱数据。如此海量的光谱数据对光谱的快速有效的处理提出了更高的要求。恒星光谱的自动分类是光谱处理的一项基本内容,该研究主要工作就是研究海量恒星光谱的自动分类技术。Lick线指数是在天体光谱上定义的一组用以描述光谱中谱线强度的标准指数,代表光谱的物理特性,以每个线指数最突出的吸收线命名,是一个相对较宽的光谱特征。研究了基于Lick线指数的贝叶斯光谱分类方法,对F,G,K三类恒星进行分类。首先,计算各类光谱的Lick线指数作为特征向量,然后利用贝叶斯分类算法对三类恒星进行分类。针对海量光谱的情况,基于Hadoop平台实现了Lick线指数的计算,以及利用贝叶斯决策进行光谱分类的方法。利用HadoopHDFS高吞吐率和高容错性的特点,结合Hadoop MapReduce编程模型的并行优势,提高了对大规模光谱数据的分析和处理效率。该研究的创新点为:(1)以Lick线指数作为特征,基于贝叶斯算法实现恒星光谱分类;(2)基于Hadoop MapReduce分布式计算框架实现Lick线指数的并行计算以及贝叶斯分类过程的并行化。

英文摘要:

Celestial spectrum contains a great deal of astrophysical information.Through the analysis of spectra,people can get the physical information of celestial bodies,as well as their chemical composition and atmospheric parameters.With the implementation of LAMOST,SDSS telescopes and other large-scale surveys,massive spectral data will be produced,especially along with the formal operation of LAMOST,2 000 to 4 000 spectral data will be generated each observation night.It requires more efficient processing technology to cope with such massive spectra.Automatic classification of stellar spectra is a basic content of spectral processing.The main purpose of this paper is to research the automatic classification of massive stellar spectra.The Lick index is a set of standard indices defined in astronomical spectra to describe the spectral intensity of spectral lines,which represent the physical characteristics of spectra.Lick index is a relatively wide spectral characteristics,each line index is named after the most prominent absorption line.In this paper,the Bayesian method is used to classify stellar spectra based on Lick line index,which divides stellar spectra to three subtypes:F,G,K.First of all,Lick line index of spectra is calculated as the characteristic vector of spectra,and then Bayesian method is used to classify these spectra.For massive spectra,the computation of Lick indices and the spectral classification using Bayesian decision method are implemented on Hadoop.With use of the high throughput and good fault tolerance of HDFS,combined with the advantages of MapReduce parallel programming model,the efficiency of analysis and processing for massive spectral data have been improved significantly.The main innovative contributions of this thesis are as follows.(1)Using Lick indices as the characteristic to classify stellar spectra based on Bayesian decision method.(2)Implementing parallel computation of Lick indices and parallel classification of stellar spectra using Bayesian based on Hadoop MapReduce d

同期刊论文项目
同项目期刊论文
期刊信息
  • 《光谱学与光谱分析》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会
  • 主办单位:中国光学学会
  • 主编:高松
  • 地址:北京海淀区魏公村学院南路76号
  • 邮编:100081
  • 邮箱:chngpxygpfx@vip.sina.com
  • 电话:010-62181070
  • 国际标准刊号:ISSN:1000-0593
  • 国内统一刊号:ISSN:11-2200/O4
  • 邮发代号:82-68
  • 获奖情况:
  • 1992年北京出版局编辑质量奖,1996年中国科协优秀科技期刊奖,1997-2000获中国科协择优支持基础性高科技学术期刊奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),荷兰文摘与引文数据库,美国工程索引,美国生物医学检索系统,美国科学引文索引(扩展库),英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘,中国北大核心期刊(2000版)
  • 被引量:40642