位置:成果数据库 > 期刊 > 期刊详情页
基于局部与全局信息的自动文摘算法
  • ISSN号:1003-9775
  • 期刊名称:《计算机辅助设计与图形学学报》
  • 时间:0
  • 分类:TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]广西工学院计算机工程系,广西柳州545006
  • 相关基金:国家自然基金项目(60673034); 2006年广西教育厅基金项目(149); 广西工学院博士、硕士基金项目资助
中文摘要:

采用平均特征词频率策略计算特征词权重,用快速n-grims算法对各特征词所处的概念体进行加权,用一种改进的K-means聚类算法进行段落聚类,提出一种基于局部与全局信息的自动文摘算法并给出算法评估。该算法不仅能够自适应获得k值,而且有效防止了初始点的随机选择对聚类结果的影响。评测结果表明该算法对经济类和科技类文章的准确率和召回率都明显高于新闻类和文学类文章,利用机器文摘进行分类的准确率明显高于使用原文本进行分类。该算法所得到的文摘,在各项指标上都优于传统方法生成的文摘。

英文摘要:

The idea of our approach is to exploit both the local and global properties of sentences.In order to obtain local property,we use a term weighting scheme that employs average term frequency in a document as the normalization factor.And a fast algorithm for matching N-grams is uesd to optimize term weighting.The method can obtain an improved K-means method to cluster paragraphs,and discovers thematic areas according to clustering results.Furthermore,it integrates local and global property to produce summarization.And experiments do prove that it is feasible to use the method to develop a domain automatic abstracting system,which is valuable for further study.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机辅助设计与图形学学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国计算机学会
  • 主编:鲍虎军
  • 地址:北京2704信箱
  • 邮编:100190
  • 邮箱:jcad@ict.ac.cn
  • 电话:010-62562491
  • 国际标准刊号:ISSN:1003-9775
  • 国内统一刊号:ISSN:11-2925/TP
  • 邮发代号:82-456
  • 获奖情况:
  • 第三届国家期刊奖提名奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:24752