高逼真度视听系统的理论与方法-东篱科研大数据发现系统（DRDS）

位置：立项数据库 > 立项详情页

高逼真度视听系统的理论与方法

项目名称：高逼真度视听系统的理论与方法
项目类别：创新研究群体科学基金
批准号：61121002
申请代码：F0205
项目来源：国家自然科学基金
研究期限：2012-01-01-2014-12-31

项目负责人：高文
负责人职称：教授
依托单位：北京大学
批准年度：2011

中文摘要：

音像完美或图像清晰的多媒体系统是家庭数字影院、数字电视、激光视盘、远程医疗等产业追求的理想目标。近年来视音频性能逐步演进，视频从标清到高清HDTV，进而到超高清UHDTV，以及三维视频；音频从单声道到立体声，进而5.1和7.1声道，甚至22.2声道。随着视音频质量的提升，数据量也在迅速增加，日本SHV系统的原始数据量甚至超过59Gbps，由此带来了很多新的技术挑战。例如，如何有效压缩音视频以便合理控制传输和存储成本。为了解决这些难题，课题组拟研究基于视觉特性和模型的高效编码理论与技术和主客观质量评价方法；研究基于计算机视觉理论的二维至三维视频转换与生成技术；研究基于统计学习的图像与视频表达模型与算法；研究复杂视听场景的虚实融合、三维呈现与交互所需的高效计算方法。课题组将参与下一代国家和国际视频编码标准制订，力争成为本领域国际上有影响的创新团队，为国家和行业的重大需求提供理论方法与核心技术

中文主题词：图像处理；视频处理；三维视频；虚拟现实；音视频标准

英文摘要：

image processing；video processing；3D video；virtual reality；audio and video standards

英文主题词： image processing；video processing；3D video；virtual reality；audio and video standards

结论摘要：

高逼真度图像、音频与视频需求带来了若干理论和方法的挑战。在过去三年中，本创新研究群体重点开展了高逼真度视听信息表示与重构的理论与方法、高逼真度视听信息编码理论与方法、视听场景呈现与高效计算等方面的研究。本创新研究群体取得的主要进展包括（1）针对高逼真度视听信息表示与重构的理论与方法，在视觉基元熵、Mumford-Shah泛函正则化理论和硬件加速重建方法、超分辨重建方面取得进展；（2）针对高逼真度视频编码理论与方法，在非精确背景建模编码方面有显著进展；（3）针对高逼真度声音场景分析、音频编码理论与方法，在声音场景分析模型和多通道编码方面取得进展；（4）针对视听场景呈现与高效计算，在全局场景构建和虚实融合、场景特征抽取取得进展。在开展上述基础研究的同时，开发了系列原型工具与平台，并将研究成果应用于多项实际项目。本创新研究群体新增国家自然科学基金委“杰出青年基金”获得者1人和“优秀青年基金”获得者1人，中国科协“求是杰出青年奖成果转化奖” 获得者1人。在本项目基金支持下，基于本项目的研究成果，本创新研究群体构建了一个基于GPU集群的多屏拼接并行绘制系统和一套22.2声道的高逼真度、高临场感的环绕声播放系统，有利于进一步开展高逼真度视听系统的研究。经过3年的发展，本创新研究群体的合作研究不断深化和聚焦，重大科学问题日趋明确，国际化水平和国际竞争力不断提升，学术环境日益和谐，为进一步的研究工作奠定了良好基础。

成果综合统计