位置:立项数据库 > 立项详情页
网络电子图书的自动编辑与维护
  • 项目名称:网络电子图书的自动编辑与维护
  • 项目类别:海外及港澳学者合作研究基金
  • 批准号:61028003
  • 申请代码:F020204
  • 项目来源:国家自然科学基金
  • 研究期限:2011-01-01-2012-12-31
  • 项目负责人:李青
  • 负责人职称:教授
  • 依托单位:武汉大学
  • 批准年度:2010
中文摘要:

利用万维网络中已有的内容来编辑电子图书在国内外都是一个新兴的领域, 其理念有别于以往数字图书馆的目标。后者侧重于对图书的数字化、存储、检索以及浏览, 而网络电子图书编辑是对网络上的海量数据进行深层次的挖掘再加工从而生成满足用户特定需求的新书的过程,具有通用性、易操作性、实时性、个性化、及互动性等特点,可以为需要了解掌握新知识领域的人们提供又快又好的学习工具。本项目的研究目标为:(1)构造概念框架;(2)正确评估网页内容的质量;(3)用户需求驱动的网络电子图书创建;(4)网络电子图书的定制和扩展, 为不同用户在不同时候的需求来方便地定制个性化的网络电子图书;(5)概念树的进化及管理。主要研究内容包括: 自动构造网络电子图书的关键技术研究(如: 自动构造概念框架, 正确评估网页内容的质量等);自动编辑网络电子图书的系统框架研究(包括: 网络电子图书的创建、定制、扩展和进化等技术)。

结论摘要:

网络电子图书编辑是通过对互联网上的海量学习资源进行收集和深层次挖掘处理,从而组织归纳出满足用户特定需求的电子书籍的过程。一本良好的电子图书是一个面向学习的领域内的网络资源导航。相对于传统的搜索引擎,我们期望建立起一个具有通用性、易操作性、实时性及能够与用户深入交互的个性化学习系统,该系统可以为人们提供方便的学习工具。围绕本项目的研究目标,我们针对其中的重点难点展开学习研究并取得了实质性的成果。主要涉及三个方面 1, 网络电子图书的概念目录树的自动汇编及更新; 2,网络电子学习资源的分类聚类及知识主题的动态更新问题; 3,个性化图书的早期探索。 我们将目录树的构建分成两个步骤来完成,首先基于Hierarchical Dirichlet Process生产出不同概念粒度的主题集合,然后基于不同概念粒度的主题集合进行层次聚类,由下而上的构建出目录层次,从而生成一个具有良好层次依赖关系的目录树结构。 这个目录树为领域知识内的电子文档集合建立一个目录式概括及导航,从而为电子图书的自动构建打下了坚实的基础。面对海量网络学习资源,我们需要高效地将获取的资源集合分门别类地映射到目录树上,针对这个动态过程,我们提出了一个将网络结构与文本信息相结合的增量聚类算法。该算法在保证聚类效果的同时极大提高了时间效率,可以满足网络电子图书应用的知识更新需求。最后,对于个性化图书需求特点,我们针对网络用户兴趣爱好的提取和分组进行了相关研究,通过将主题模型和基于排序的结构模型相结合的方式,提出了基于兴趣关注热度和兴趣关注排序这两个维度的用户兴趣分组模型,为进一步地研究个性化图书应用提供了基础。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 0
  • 3
  • 0
  • 0
  • 0
相关项目
期刊论文 30 会议论文 1
李青的项目