位置:成果数据库 > 期刊 > 期刊详情页
面向FT1000微处理器的STREAM并行计算与优化
  • ISSN号:1007-130X
  • 期刊名称:《计算机工程与科学》
  • 时间:0
  • 分类:TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]国防科学技术大学并行与分布处理重点实验室,湖南长沙410073
  • 相关基金:国家863计划资助项目(2012AA01A301); 国家自然科学基金资助项目(60970033,91430218)
中文摘要:

STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小确定数据预取的数目,使用汇编语言编写了优化子程序。基于OpenMP并行环境,设计了STREAM并行程序,优化了局部化数据分配方式。数据测试结果表明,优化后的STREAM的性能比原始串行程序性能提高了19.2%-64.2%。优化后,并行程序的最高访存性能达到8.5GB/s,对比优化前的最高访存性能最大提高了22.7%。

英文摘要:

STREAM benchmark measures the memory bandwidth of microprocessors. It is a chal- lenge to get high performance of STREAM benchmark on the massively multithreaded FT1000 proces- sors. Based on the hierarchical cache, the instruction pipelines of four routines of STREAM are opti- mized. Then,a multilevel loop unrolling method is proposed according to the number of registers, the prefetched data sizes are determined by the instruction delay and the cache line size, and the optimized subroutines are written in assembly language. Under the OpenMP parallel computing environment, the parallel codes for STREAM benchmark are given with the local data optimized methods. The test results of STREAM codes with performance optimization show that the performance increases by 19.2-64.2% for sequential computation. The highest memory bandwidth of the parallel optimized codes is 8.5GB/s. In comparison to the original parallel codes, the performances of the parallel optimized codes is improved by 22.7 % .

同期刊论文项目
期刊论文 26 会议论文 11 专利 3
同项目期刊论文
期刊信息
  • 《计算机工程与科学》
  • 中国科技核心期刊
  • 主管单位:国防科学技术大学
  • 主办单位:国防科学技术大大学计算机学院
  • 主编:王志英
  • 地址:湖南长沙德雅路109号
  • 邮编:410073
  • 邮箱:jsjgcykx@163.net
  • 电话:0731-84576405
  • 国际标准刊号:ISSN:1007-130X
  • 国内统一刊号:ISSN:43-1258/TP
  • 邮发代号:42-153
  • 获奖情况:
  • 湖南省优秀期刊,首届国防科技期刊优秀期刊,《CAJ-CD规范》执行优秀期刊
  • 国内外数据库收录:
  • 英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:16422