随着密集计算类应用蓬勃兴起和VLSI技术不断发展,流计算模型研究获得了巨大的应用驱动和基础技术支撑。以流计算模型为基础,构建新型体系结构,适合于更大规模集成电路,成为学术前沿关注的焦点。本项目研究以面向未来超十亿只晶体管时代1K ALU以上规模的众核微处理器为目标,以支持同时多粒度并行为特点,开展适用于流计算的新型体系结构研究。其主要思想是将并行性开发与硬件多态化相结合,使得流计算可以在一定的体系结构框架下,针对不同的应用需求实现自己独特的并行执行模式和并行数据粒度。本研究首次提出Tile化众核流体系结构、同时多粒度并行调度和节点多态化等关键技术的研究方法,具有原创意义,对我国未来高性能图像信号处理、音视频编解码、数字通信、密码和科学计算等领域中的核心处理芯片研发将会产生积极影响。
stream processor;parallelsim;media computing;many-core;platform
本课题按原定计划书顺利推进,圆满完成了合同要求的研究任务,完成了各分项研究的相关工作,在三年时间里取得多项研究成果。在课题研究中,我们提出了基于流计算模型的同时多粒度并行众核体系结构TISA(Tiled Stream Architecture),采用Tile化的众核结构提升流处理器的扩展层次,可以集成更高密度的计算单元和实现更低的能耗,为开发并行性提供足够的空间。TISA支持多粒度并行和多层次的节点组织,包括计算簇层、流处理器核层和Tile格点层,对不同的并行可采用不同的硬件集合来完成。各个计算资源之间有丰富的互连网络和存储资源。通过虚跨步流传输通道和多模式访存技术,使多个计算节点能够灵活的聚合或分裂,从而支持同时多粒度并行和各种非规则流计算。在TISA流处理内核的研究中更注重降低硬件复杂度、提高资源使用效率和灵活性,强调性能功耗比。由于流计算模型展现出的高度规则性和可预知性,流处理器可更多的采用软件管理技术,例如超长指令字、静态路由调度、多粒度分层软件管理存储器等,避免大量采用复杂的硬件逻辑,从而节省能耗和芯片面积。我们的研究将并行化、众核化和多态化结合起来,在为流应用领域提供更强大计算能力的同时,解决了流处理器的适用性和扩展性问题。课题研究中还建立一套众核流体系结构软硬件研究平台,扩展和完善了能够验证大规模众核流体系结构的软件模拟器和FPGA硬件验证平台,为新型流体系结构的研究和设计验证提供基础在项目的资助下,同多名学者合作出版专著2部《流处理器研究与设计》,《流计算和视频编码》,获国家发明专利授权4项,软件著作权2项,项目组在ACM Multimedia、ACM FPGA、IEEE Cluster、ICPADS 、FPL、Journal of Supercomputing等重要国际会议和国际期刊上发表论文40余篇,其中SCI检索4篇,EI检索23篇。培养研究生6名,获得湖南省优秀博士学位论文奖1人。参加国内国际学术会议6人次,组织国际交流互访2次,2012年派遣赴挪威联合培养学生1人,2012年挪威国家研究委员会特聘访问科学家1人。