位置:成果数据库 > 期刊 > 期刊详情页
一种基于特征信息的Blog自动文摘研究
  • ISSN号:1001-3695
  • 期刊名称:计算机应用研究
  • 时间:2011
  • 页码:3760-3763
  • 分类:N941[自然科学总论—系统科学]
  • 作者机构:[1]苏州大学智能信息处理及应用研究所,江苏苏州215006, [2]苏州大学计算机科学与技术学院,江苏苏州215006, [3]江苏省现代企业信息化应用支撑软件工程技术研发中心,江苏苏州215104
  • 相关基金:国家自然科学基金资助项目(60970015 61003054); 2009年江苏省基础研究计划企业博士创新项目(BK2009563); 江苏省高校自然科学研究项目(10KJB520018); 苏州市科技型企业技术创新资金专项项目(SG201043)
  • 相关项目:Deep Web敏感聚合信息保护方法研究
中文摘要:

为了有效地对Blog进行摘要抽取,以一种合理的方式挑选出对Blog摘要抽取有帮助的评论,然后在考虑句子词频的基础上结合Blog的结构化信息和挑选出的评论信息来计算Blog句子权重。针对基于句子权重选择摘要句容易忽略次要主题的缺陷,提出一种结合Blog段落形式特点进行二次摘要抽取的解决方法。在随机下载的Blog数据中进行了实验,该方法具有较好的覆盖性和概括性。

英文摘要:

To help extract the summary of a Blog effectively,first selected a number of comments in the Blog in a reasonable way.Then,based on considering word frequency in the sentence,this paper calculated the weight of the sentence in the Blog,combined with structured information and the selected comments.However,this method was easy to neglect the minor subject.After that,to overcome the drawback,proposed a solution of secondary Abstract extract through the characteristics of paragraph form in the Blog.Finally,an experiment was done with Blog data random downloaded on the Internet,demonstrating the method has a better spreadability and generality.

同期刊论文项目
期刊论文 49 会议论文 8 专利 6
期刊论文 37 会议论文 4 获奖 3 专利 3
同项目期刊论文
期刊信息
  • 《计算机应用研究》
  • 北大核心期刊(2011版)
  • 主管单位:四川省科学技术厅
  • 主办单位:四川省计算机研究院
  • 主编:刘营
  • 地址:成都市成科西路3号
  • 邮编:610041
  • 邮箱:arocmag@163.com
  • 电话:028-85210177 85249567
  • 国际标准刊号:ISSN:1001-3695
  • 国内统一刊号:ISSN:51-1196/TP
  • 邮发代号:62-68
  • 获奖情况:
  • 第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:60049