位置:立项数据库 > 立项详情页
基于视觉感知的嵌入式多视点视频编码方法研究
  • 项目名称:基于视觉感知的嵌入式多视点视频编码方法研究
  • 项目类别:青年科学基金项目
  • 批准号:60902066
  • 申请代码:F010406
  • 项目来源:国家自然科学基金
  • 研究期限:2010-01-01-2012-12-31
  • 项目负责人:朱仲杰
  • 负责人职称:教授
  • 依托单位:浙江万里学院
  • 批准年度:2009
中文摘要:

多视点视频是一种能提供立体感和交互性操作的新型视频,未来在立体电视、立体电影、虚拟现实、机器视觉、远程医疗等领域有着广泛的应用前景。传统面向存储的编码方法单纯追求编码效率而没有考虑网络传输的要求,使得编码压缩后码流的网络适应性较差,难以满足复杂网络环境下的传输要求。本项目结合人眼视觉特性,研究面向传输的嵌入式多视点视频编码新方法,以提高编码效率和压缩后码流的网络适应性,同时增强多视点视频重建后的主观视觉效果。着重解决以下关键问题基于视觉兴趣的多视点视频信号的高效分解;具有良好网络自适应性的高效嵌入式编码方法;基于率失真优化的信源信道联合编码中的比特分配与码率控制理论。项目的研究进展和预期成果将有助于提高我国在多视点视频领域的研究水平,有助于推动网络多媒体中多视点视频技术的早日成熟。

结论摘要:

多视点视频是一种能提供立体感和交互性操作的新型视频,未来在立体电视、立体电影、虚拟现实、机器视觉、远程医疗等领域有着广泛的应用前景。但传统面向存储的编码方法单纯追求编码效率而没有考虑网络传输的要求,使得编码压缩后码流的网络适应性较差,难以满足复杂网络环境下的传输要求。本项目结合人眼视觉特性,研究了面向传输的嵌入式多视点视频编码新方法,在基于视觉兴趣的多视点视频信号的高效分解、符合视觉感知的多视点视频质量评价准则、高效嵌入式编码方法、基于率失真优化的比特分配与码率控制等主要问题上取得了一系列研究进展并有多处创新。主要包括1)在现有视觉生理学和视觉心理学研究成果的基础上,深入分析了多视点视频中的主要人眼视觉特性,研究建立了深度敏感度函数(dsf),多分辨率局部对比度和对比度敏感度等重要视觉感知模型; 2)基于视觉生理与心理学的现有研究成果,基于建立的视觉感知模型,提出一种基于3D小波分解的多视点视频质量评价模型,与传统的PSNR等常见评价方法相比,新模型能更好的匹配人眼主观视觉效果。3)研究提出了基于有限混合模型(FMM)的语义图像与视频分割新算法和面向3D和多视点视频的目标分割与快速跟踪算法,与传统方法相比能获得较准确的语义对象分割与跟踪效果并具有较好的视觉感知匹配性。4)研究提出了对象基嵌入式图像编码方案。方案首先将图像分割成具有不同视觉兴趣的对象,对不同视觉对象进行独立编码,生成各自独立的码流,然后根据给定码率、对象优先级等参数对对象压缩码流进行优化截取和重新组装,得到给定码率下的最佳码流。与传统编码方法相比,可以提高码流的网络适应性,同时增强重建后图像的主观视觉效果。通过本项目的研究,获得了一批较重要的研究成果,较高质量地完成了项目可行性报告和申请书中预期的研究内容和研究目标。已在IEEE Tran., ELSEVIER,EURASIP等国际期刊上发表研究论文12篇,其中SCI检索论文5篇。申请发明专利1项,另有5篇论文和2项专利已经完成,待发表和申请, 同时获得包括浙江省高校科研成果二等奖在内的市级以上科研奖励2项。项目研究提出的相关编码理论和关键算法可直接应用于3D电视、立体电影、虚拟现实、机器视觉、远程医疗等应用领域,有助于推动相关多视点视频技术的成熟和应用。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 14
  • 1
  • 1
  • 0
  • 0
相关项目
期刊论文 4 会议论文 2
期刊论文 28 会议论文 7 专利 3
期刊论文 17 会议论文 16
期刊论文 11 会议论文 4 专利 10
朱仲杰的项目