面向中文文本信息融合的句子排序研究-东篱科研大数据发现系统（DRDS）

位置：立项数据库 > 立项详情页

面向中文文本信息融合的句子排序研究

项目名称：面向中文文本信息融合的句子排序研究
项目类别：青年科学基金项目
批准号：60703008
申请代码：F020601
项目来源：国家自然科学基金
研究期限：2008-01-01-2010-12-31

项目负责人：文卫东
负责人职称：副教授
依托单位：武汉大学
批准年度：2007

中文摘要：

Internet的发展使得各种信息急剧增加，信息检索是人们高效获取所需信息必不可少的渠道，文本信息融合技术可将来自多个信息源的文本信息片段综合整理，有效地减轻了对检索结果的阅读负担。将多个信息源（文档）的信息组合成逻辑性强、一致性高的一篇文本，需要对相应的信息片段（句子）进行排序，排序的结果直接关系到所生文本的可读性。目前国内对文本信息融合中句子排序的研究只局限于在多文档自动文摘或问答系统中简单提到，还没有把它专门作为一个课题进行深入的研究，国际上也没有专门针对中文文本的句子排序研究。本项目通过人工分析与数据挖掘相结合的办法，分析人在中文句子排序时的行为模式，总结出句子排序时可用到的各种特征，并对其进行量化，在此基础上集成各项特征，设计排序模型，通过句子与句子之间关系构建有向图，用改进的PageRank方法对图中节点进排序。最后将排序模型集成在文本信息融合系统中，提高文本信息融合结果的质量。

中文主题词：中文句子排序；信息融合；MDS；优先关系图；基本要素

结论摘要：

英文主题词Chinese Sentence Ordering; Information Fusion; MDS; Precedence diagram; Basic Elements

成果综合统计