位置:立项数据库 > 立项详情页
应用于面向问题的自动文摘任务的篇章分析关键技术研究
  • 项目名称:应用于面向问题的自动文摘任务的篇章分析关键技术研究
  • 项目类别:面上项目
  • 批准号:60875042
  • 申请代码:F030509
  • 项目来源:国家自然科学基金
  • 研究期限:2009-01-01-2011-12-31
  • 项目负责人:李素建
  • 负责人职称:副教授
  • 依托单位:北京大学
  • 批准年度:2008
中文摘要:

面向问题的自动文摘任务主要采用基于简单特征的句子抽取方法,存在摘要句信息冗余大、主题不连贯、不能很好地回答问题等缺陷。为了改善摘要性能,本申请提出引入篇章分析的理论和技术,从三个方面展开研究第一,从语言学角度出发,并综合考虑篇章分析的可计算性,融合了修辞结构理论(RST)和语篇向心理论(CT),综合语句的修辞关系和话题转移关系定义了篇章标注体系,并提出了基于条件随机场的自动篇章标注方法;第二,为了使主题连贯均衡地分布在摘要中,提出了利用篇章关系构建主题模型,在语句层和词汇层建立了双层主题结构,在词汇层为主题构造层级概率生成模型,并通过语句的篇章关系调整主题的划分;第三,由于问题回答(QA)融入了自动文摘任务中,课题针对复杂观点型问题提出了判别和分析方法,以及文本语句观点倾向性分析的方法。本申请的研究成果,不仅为改进自动文摘系统提供了一种新的思路,而且为篇章分析等工作提供了基础资源和技术。

结论摘要:

英文主题词Question-Focused Automatic Summarization;Text Analysis;Topic Analysis;Opnion Analysis


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 8
  • 7
  • 1
  • 0
  • 0
相关项目
期刊论文 27 会议论文 24 获奖 4
李素建的项目
期刊论文 27 会议论文 24 获奖 4