位置:成果数据库 > 期刊 > 期刊详情页
龙芯3B的SIMD编译优化及分析
  • ISSN号:1000-1220
  • 期刊名称:《小型微型计算机系统》
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学技术大学计算机学院,合肥230027, [2]安徽省计算与通信软件重点实验室,合肥230027, [3]中国科学技术大学中科院沈阳计算所网络与通信联合实验室,合肥230027
  • 相关基金:国家“核高基”重大专项项目(2009ZX01028-002-003-005)资助; 国家自然科学基金项目(60833004)资助; 安徽省高等学校省级自然科学研究重点项目(KJ2012A008)资助
中文摘要:

提出一种按照计算域分解的并行化方法来构建等几何分析的刚度矩阵和右侧向量.将计算域分解成为若干个不相交的子区域,然后为每个区域分配一个处理器,所有处理器并行进行子区域上面的计算,所有处理器完成子区域的计算以后,使用一个快速的归并算法完成线性系统的装配.实验表明,本文提出的方法在8核的机器上可以达到6.46的加速比,能够在4秒左右的时间计算680万个矩阵元素个数.使用Intel MKL稀疏求解器来求解线性系统,本文的等几何分析求解器能够在大约10秒的时间内求解52万的自由度,本文的方法比ISOGAT速度要快上万倍.

英文摘要:

This paper proposes a parallel method based on the computational domain decomposition to construct the stiffness matrix and right hand side vector for IsoGeometric Analysis. The parallel method decomposes the computational domain into a set of disjoint sub- domains. Each subdomain is allocated to one processor. All processors perform the computation on its subdomain paraileUy. After all the computation is completed, a fast merge algorithm is executed to complete the assembling of the linear system. This method a- chieved the speedup of 6.46 on an 8-core CPU. With this method, 6.8 million elements can be computed in about 4 seconds. With Intel MKL Sparse Solver, a system with 520 thousand degrees of freedom can be solved in about 10 seconds. The method proposed in this paper is 10 thousand times faster than ISOGAT.

同期刊论文项目
期刊论文 75 会议论文 63 专利 12
同项目期刊论文
期刊信息
  • 《小型微型计算机系统》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院沈阳计算技术研究所
  • 主编:林浒
  • 地址:沈阳市浑南新区南屏东路16号
  • 邮编:110168
  • 邮箱:xwjxt@sict.ac.cn
  • 电话:024-24696120 024-24696190-8870
  • 国际标准刊号:ISSN:1000-1220
  • 国内统一刊号:ISSN:21-1106/TP
  • 邮发代号:8-108
  • 获奖情况:
  • 中国自然科学核心期刊,中国科学引文数据库来源期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23212