位置:成果数据库 > 期刊 > 期刊详情页
基于优先权过滤的自动摘要抽取算法
  • ISSN号:1000-274X
  • 期刊名称:《西北大学学报:自然科学版》
  • 时间:0
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]西北大学信息科学与技术学院,陕西西安710127, [2]北京师范大学信息科学与技术学院,北京100875
  • 相关基金:国家自然科学基金资助项目(61373117)
中文摘要:

提出一种基于句子选择的中文自动摘要抽取算法。算法思想是结合单文档的文档结构、篇章结构、句子特征,按照特征优先权过滤,同时利用进化算法良好的自适应性调节特征因子,通过打分函数自动给句子打分排名,选择得分较高的句子作为摘要句。实验采用中文文档数据集进行测试,采用标准的ROUGE—N评估方法,实验表明该算法针对中文文献取得了良好的效果。

英文摘要:

An automatic extractive summarization algorithm about Chinese documents based on sentence selection is proposed in this paper. The idea of the algorithm is to combine the document structure, chapter structure and sentence feature of the single document, and to integrate the feature priority based sentence filtering method with genetic algorithm which has good adaptability to seek an optimal combination of sentence's features. With the sentences scored automatically, we generate the summary by extracting some higher score sentences in top according to their original sequence in the document. The Chinese documents downloaded from the internet are adopted in the experiments using the ROUGE-N to evaluate the results. This experiment shows that this method has achieved good results.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《西北大学学报:自然科学网络版》
  • 主管单位:
  • 主办单位:
  • 主编:姚运
  • 地址:西安市太白北路299号
  • 邮编:710069
  • 邮箱:
  • 电话:029-88303833
  • 国际标准刊号:ISSN:1000-274X
  • 国内统一刊号:ISSN:61-1072/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:16