近年来,伴随着视频压缩与互联网技术的广泛普及,多媒体计算蓬勃兴起,逐渐成为通用CPU的主流计算之一。它们对计算能力的急剧需求给通用CPU体系结构的设计带来了新的挑战计算能力的提升严重滞后流处理计算要求,并且现有存储结构不能满足其数据访问行为特征。虽然以流处理器为代表的专用处理器针对此类应用展现出了巨大的计算性能潜力,但是其不能满足通用性需求。本课题针对多媒体应用日益提升的计算需求与通用CPU相对滞后的流处理能力之间的矛盾,引入流体系结构特征,提出了支持高效流处理的通用CPU体系结构,为有效组织和利用丰富的芯片资源提供有力支持。将在高效能通用CPU流存储结构、超高位宽数据并行加速器设计、支持流处理的高效能编程模型及其编译优化技术、通用CPU流模型的多核扩展方法等不同的层面,深入研究支持高效流处理的通用CPU体系结构关键技术,为未来通用CPU的发展奠定坚实的基础。
stream processing;general-purpose CPU;data parallel;programming model;compilation optimization
近年来,以图像以及视频流应用为代表的多媒体计算蓬勃兴起,逐渐成为通用CPU 的主流计算之一。为了控制逐渐提高的芯片开发成本,满足主流计算对高性能与低功耗的需求,人们渴求一种通用的CPU体系结构来满足各种不同标准的多媒体应用。这种对计算能力的急剧需求给通用CPU体系结构的设计带来了新的挑战计算能力的提升严重滞后流处理计算需求,并且现有存储结构不能满足其数据访问行为特征。虽然以流处理器为代表的专用处理器针对此类应用展现出了巨大的计算性能潜力,但是其不能满足通用需求。本项目针对流处理应用日益迫切的计算需求与相对低下的通用CPU计算能力之间的矛盾,引入在计算密集型应用中已经日趋成熟的流处理器技术,提出基于流模型的通用CPU体系结构,在高效能通用CPU流存储结构、高效能超高位宽数据并行加速器设计、面向流应用的高效能数据并行编程模型与编译优化技术以及通用CPU流模型的多核扩展方法等不同的层面,形成了高效支持流处理的通用CPU 体系结构关键技术。这为解决阻碍通用CPU的流处理性能提升问题探索了新的道路,具有重要的理论和现实意义。在课题研究期间,共发表高水平论文22篇,其中SCI 期刊论文10篇(IEEE/ACM Transactions期刊5篇)。出版英文学术专著1本(由著名Morgan Kaufmann出版社出版),申请专利9项,获得授权3项。毕业博士研究生5名,硕士研究生4名。课题所形成的部分成果获2012年湖南省自然科学优秀学术论文一等奖与2013年湖南省自然科学奖二等奖。