数据压缩一直是体数据可视化研究中的一个重要问题,随着精度要求的提高和应用需求的增长,体数据的维数、分辨率、变量个数不断增加,数据量呈指数增长,传统的压缩方法由于受到了内存空间和计算能力的制约,不能胜任大尺度多维体数据的压缩工作。围绕这一问题,本项目预备开展三方面的研究工作首先,建立基于多分辨率和数据分块的体数据压缩方法,满足不同分辨率和局部可视化需要,同时充分开发各维数据间相关性;其次,开发高效的稀疏残差数据的管理机制,保存前期压缩后的残差数据,可视化时快速地查询残差并补偿压缩后的数据,获得高的可视化精度;再次,利用数值计算方法加速数据压缩的计算过程,降低压缩时间;最后,利用新的计算理论,直接在GPU中对压缩数据进行快速地可视化计算,从而摆脱了解压过程,加快了可视化速度,并降低了存储量。
data compression;data reduction;large-scale;interactive visualization;
随着数据获取手段的进步,可视化数据的数据量急剧增长,传统的数据压缩方法面临新的挑战。一方面对可视化中的体数据这类空间数据需要进一步提高压缩比以适应存储和传输限制,对非空间数据也需开发数据简化、数据清理等技术以加快可视化的速度;另一方面,数据的增长使得压缩和简化阶段变得日益耗时,因而需开发快速数值技术方法以加快压缩和简化过程;此外基于压缩数据的快速可视化技术是实现对大数据交互可视化的一种重要手段。针对这些问题,本项目展开了以下一些方面的研究使用机器学习、张量分析等方法提高规则体数据的压缩效率,并研究了在压缩过程中引入了人的感知因素,使得压缩结果更符合人的视觉感知;对非规则体数据利用基函数拟合和LR环技术进行简化和压缩;对文本等非空间数据采用降维等方法进行简化。开发了快速的SVD和Perfect Hash对数据压缩和简化过程进行了加速。研究了直接基于前述的压缩和简化后数据的快速可视化方法,并把一些技术推广到其他领域。