东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于可重构计算系统的矩阵三角化分解硬件并行结构研究

ISSN号：0372-2112
期刊名称：《电子学报》
时间：0
分类：TP102.1[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
作者机构：[1]哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨150001
相关基金：国家自然科学基金（No.61003036）;计算机体系结构国家重点实验室开放课题（No.CARCH201301）;博士后科研启动基金（No.LBH-Q12134）;中央高校基本科研业务经费专项基金（N0.HEUCF100606）

作者：刘书勇[1], 吴艳霞[1], 张博为[1], 张国印[1], 戴葵[1]

关键词：矩阵三角化分解, 三角化过程, 并行算法, LU分解, 现场可编程门阵列, matrix triangularization decomposition, triangularization process, parallel algorithm, LU decomposition, field programmable gate array

中文摘要：

可重构计算系统成为加速计算密集型应用的重要选择之一．在众多受到关注的计算密集型问题中，矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位，在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值．本文面向矩阵三角化分解中共有的三角化计算过程，通过分析该过程的线性计算规律，提出一种适于硬件并行实现的子矩阵更新同一化算法及矩阵三角化计算FPGA（Field ProgrammableGate Array）并行结构．针对LU矩阵三角化分解在并行结构模板上的高性能实现及优化方法开展了研究．理论分析表明，该算法针对矩阵三角化计算过程具有更高的数据并行性与流水并行性；实验结果表明，与通用处理器的软件实现相比，根据该算法实现的矩阵三角化分解FPGA并行结果在关键计算性能上可以取得10倍以上的加速比．

英文摘要：

The reconfigurable computing system became an important choice according to accelerating compute-intensive applications. Among most compute-intensive applications, the matrix triangularization decomposition always was in the central position of research subjects and presented a great value to solve linear equation systems and matrix eigenvalue problems in science or engineering area. This paper analyzed the linear computing process of triangularization and proposed a hardware-adaptive parallel submatrix identity updating algorithm and a high-performance parallel structure hardware template for matrix triangularization on FPGA （Field Programmble Gate Array ） according to the common triangttladzation computing process of the matrix triangularization decomposition. The research focused on the high-performance FleA parallel structure implementation and optimization methods for the LU matrix triangularization decomposition. In theoretical analysis, the proposed algorithm presents better pipeline-parallelism and data-parallelism during the matrix triangularization process. The experimental result shows that the proposed structure gets over decuple speedup compared to general-purpose processors and the previous works in vital performance.

同期刊论文项目

　面向FPGA硬件设计的循环特征提取技术研究

期刊论文 4

面向基于FPGA的细粒度可重构混合系统的编译技术研究

期刊论文 36 会议论文 5 专利 3

同项目期刊论文

Auto Estimation Model of FPGA based Delay for theHardware/Software Partitioning

Improved FPGA-Based Area Estimation Method for Hardware/Software Partitioning

面向 C2VHDL 编译器的基本块级指针分析算法

Rapid FPGA-based delay estimation for the hardware/software partitioning

Automatic Mapping of Nested Non-counting Loop onto FPGAs

A Computation and Storage Trade-Off in Mapping 2-D Convolution Networks on Field Programmable Gate A

A Rotation-based Data Buffering Architecture for Convolution Filtering in a Field Programmable Gate

基于粒子群优化算法的异构多处理器任务调度

一种粒子群优化的异构多处理器任务调度算法

基于脉动阵列的HMMer加速系统

RAM Access Optimization Strategy Oriented to Reconfigurable Compiling Technique

基于 J2EE 网络教学系统的设计与实现

一种快速求解二值线性方程组的并行结构

面向可重构编译技术的RAM访问优化算法

面向应用的可重构编译器ASCRA(英文)

基于同时多线程的TBHBP分支预测器研究

一种改进的自适应时钟算法

基于粒子群优化的异构多处理器任务调度算法

基于混合粒子群优化的CMP线程调度方法

基于同时多线程的IFSBSMT取指策略研究

改进的CFCSS控制流检测算法

基于VHDL语言的参数化设计方法

Scheduling Algorithms for Compiler of Loop Pipelining Designs on FPGAs

基于edge profiling的循环运行时信息分析方法

基于异构多核处理器的静态任务调度研究

非计数类循环的C2VHDL编译方法

面向内容中心网络基于分布均匀度的蚁群路由策略

基于任务复制的多关键路径任务调度算法

基于蚁群优化算法的异构多核线程调度方法

基于异构CMP的静态任务调度研究

一种全局较优的静态任务调度算法

面向ASCRA的循环流水启动间距自动分析及优化

面向类仿射型数组下标应用的参数化并行存储结构模板

基于LLVM的函数内联优化技术研究

面向ASCRA的循环流水启动间距自动分析及优化

面向类仿射型数组下标应用的参数化并行存储结构模板

基于LLVM的函数内联优化技术研究

期刊信息

《电子学报》
中国科技核心期刊

主管单位:中国科学技术协会
主办单位:中国电子学会
主编：郝跃
地址：北京165信箱
邮编：100036
邮箱：new@ejournal.org.cn
电话：010-68279116 68285082

国际标准刊号：ISSN：0372-2112
国内统一刊号：ISSN：11-2087/TN
邮发代号:2-891

获奖情况:
2000年获国家期刊奖,2000年获国家自然科学基金志项基金支持,中国期刊方阵“双高”期刊

国内外数据库收录:
美国化学文摘（网络版）,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,英国英国皇家化学学会文摘,中国北大核心期刊（2000版）

被引量:57611