位置:成果数据库 > 期刊 > 期刊详情页
基于龙芯2F体系结构的BLAS库优化
  • ISSN号:0253-2778
  • 期刊名称:《中国科学技术大学学报》
  • 时间:0
  • 分类:TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学技术大学计算机系,安徽合肥230027, [2]安徽省计算与通信软件重点实验室,安徽合肥230027, [3]国家高性能计算中心(合肥),安徽合肥230026
  • 相关基金:当代并行机的并行算法应用基础研究(60533020)资助.致谢 中国科学院计算技术研究所微处理器技术研究中心和国家智能计算机研究开发中心提供了龙芯2F的详细资料以及一些软件工具,对他们的支持,在此表示诚挚的感谢.
中文摘要:

在KD-50-Ⅰ平台上,基于常用优化技术,根据龙芯2F体系结构的特点,在数据预取、指令调度方面,针对高性能计算机系统中能有效解决线性代数问题的子程序集合BLAS,提出了新的优化技术,充分发挥龙芯2F处理器的性能,实现了高性能的BLAS.实际测试表明,高性能BLAS在750MHz的龙芯2F处理器(双精度浮点峰值3Gflops)上HPL实测峰值达到1.47GHz,比原始BLAS提高了6倍以上,比ATLAS提高了45%.

英文摘要:

BLAS are standard operations to efficiently solve the linear algebra problems on high performance computers. Some new optimization technologies on data prefetch and instruction scheduling developed specifically for Loongson 2F characteristics were proposed based on normal optimization technologies to give full play to develop the performance of Loongson 2F processer and implement a high performance BLAS on KD-50-Ⅰ platform. According to the experiments, the actual double float operation peak of high performance BLAS on 750 MHz Loongson 2F processor(double float peak 3 Gflops) can reach 1.47 GHz, which is more than 6 times higher than BLAS, and 45% higher than ATLAS.

同期刊论文项目
期刊论文 128 会议论文 7
同项目期刊论文
期刊信息
  • 《中国科学技术大学学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国科学技术大学
  • 主编:何多慧
  • 地址:安徽省合肥市金寨路96号
  • 邮编:230026
  • 邮箱:JUST@USTC.EDU.CN
  • 电话:0551-63601961 63607694
  • 国际标准刊号:ISSN:0253-2778
  • 国内统一刊号:ISSN:34-1054/N
  • 邮发代号:26-31
  • 获奖情况:
  • 1999年,全国优秀高等学校自然科学学报及教育部优...,2001年,安徽省1999-2001年度优秀科技期刊一等奖,2002年,第三届华东地区优秀期刊奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:8237