位置:立项数据库 > 立项详情页
面向数据密集型计算的概率图模型构建与推理
  • 项目名称:面向数据密集型计算的概率图模型构建与推理
  • 项目类别:地区科学基金项目
  • 批准号:61163003
  • 申请代码:F020204
  • 项目来源:国家自然科学基金
  • 研究期限:2012-01-01-2015-12-31
  • 项目负责人:刘惟一
  • 依托单位:云南大学
  • 批准年度:2011
中文摘要:

随着Web应用的普及和信息采集技术的进步,海量数据成为了各类应用的核心,数据密集型计算是目前研究的热点。对海量数据进行高效的统计分析,是数据密集型计算的重要任务和关键技术之一。贝叶斯网是一种重要的概率图模型,是不确定性知识表示和推理的有效框架,从海量数据中发现所蕴含的贝叶斯网,可进行海量数据的处理、分析和理解,进而支持其上的决策、预测及商务智能等应用。本项目基于MapReduce数据密集型计算技术,扩展传统的贝叶斯网构建和推理机制,研究从海量数据中学习贝叶斯网的方法,针对快速变化数据的贝叶斯网增量维护算法,以及贝叶斯网的分布式存储和高效概率推理技术,并对新方法进行理论分析及实验测试。研究成果将为数据密集型计算提供有效的支撑技术,为海量数据分析和理解提供新的解决思路,具有重要的理论意义和应用价值。预期在国内外重要期刊及会议上发表论文15篇,开发面向数据密集型计算的贝叶斯网构建与推理原型系统。

结论摘要:

通过对项目中关键问题的深入研究,取得了面向数据密集型计算的概率图模型构建和推理的阶段性研究结果,对照项目申请书和计划任务书中,已按时完成了预期的目标和任务。在理论方法与支撑技术方面1)面向海量数据分析和基于概率图模型的知识发现问题,以贝叶斯网(BN)这一重要概率图模型的构建和推理为核心,扩展现有方法、基于数据密集型计算平台与技术,提出了针对数据海量、分布式、动态和不确定性的BN构建框架和算法;2)在所构建模型的基础上,提出了面向数据密集型计算的BN概率推理方法;3)将模型的构建与概率推理方法用于Web服务数据、社会用户行为数据、无线传感器网络数据的分析,提出了知识发现支撑技术,以及相应的优化策略。通过理论分析和实验测试,验证了方法的高效性、正确性和可用性,也设计并开发了相应的原型系统。 作为这些研究结果的体现,本项目资助在本领域国内外重要期刊及会议上发表了31篇学术论文(其中SCI收录及源刊11篇,EI收录及源刊22篇次,CPCI-S收录及源刊10篇次);申请发明专利6项(其中授权2项,公开3项,受理1项),申请获得计算机软件著作权登记5项;出版专著1部、参编专著1部、参编译著1部;获得省部级奖励1项;依托于本项目的研究,培养青年教师5名、在站博士后1名、博士生6名、硕士生30名。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 27
  • 12
  • 0
  • 0
  • 3
相关项目
期刊论文 22 获奖 1 著作 1
期刊论文 74 会议论文 15 获奖 1 著作 1
刘惟一的项目