作为一种能从海量信息中快速、准确地获取有用信息的手段,自动文摘技术越来越引起人们的重视,尤其是如何从海量的Web话题信息中提取文摘内容的多文档文摘技术作为一个新的研究点,引起了研究界和产业界的广泛关注。Web话题带有内容多元性、动态演化性等特点,由此给Web话题的多文档文摘方法的研究带来了众多的挑战。面对Web话题分析的挑战,本课题在Web话题的特点分析的基础,从面向话题的多文档文摘方法的研究入手,分别从文摘计算粒度、话题表示与模型优化两方面开展面向话题的多文档文摘的研究,同时针对面向Web话题动态演化性的文摘需求,开展了动态多文档文摘的研究。本课题内容立足于研究Web2.0环境下面面向话题的自动文摘技术,既有重要的研究价值,又有广阔的应用前景,将为网络舆情分析、信息内容安全等重要应用提供关键技术支持。
web topic;automatic summarization;topic analysis;diversity;dynamic evolutionary
作为一种能从海量信息中快速、准确地获取有用信息的手段,自动文摘技术越来越引起人们的重视,尤其是如何从海量的Web话题信息中提取文摘内容的多文档文摘技术作为一个新的研究点,引起了研究界和产业界的广泛关注。Web话题带有内容多元性、动态演化性等特点,由此给Web话题的多文档文摘方法的研究带来了众多的挑战。面对Web话题分析的挑战,本课题在Web话题的特点分析基础上,从面向话题的多文档文摘方法的研究入手,分别从文摘计算粒度,话题表示与模型优化两方面开展面向话题的多文档文摘研究,同时针对面向Web话题动态演化性的文摘需求,开展了动态多文档文摘的研究。本课题内容立足于Web2.0环境下面向话题的自动文摘技术,既有重要的研究价值,又有广阔的应用前景,将为网络舆情、信息内容安全等重要应用提供关键技术支持。