位置:成果数据库 > 期刊 > 期刊详情页
代表性博文选择的博客兴趣建模
  • ISSN号:1000-1220
  • 期刊名称:《小型微型计算机系统》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]武汉大学计算机科学与技术学院,武汉430079, [2]长江大学计算机科学与技术学院,湖北荆州434023
  • 相关基金:国家自然科学基金项目(60773011)资助
中文摘要:

随着博客信息源成指数级的增长,在博客空间中的信息检索,知识发现等任务正面临着巨大的挑战.博客特有的格式为以博客为载体的数据挖掘任务带来不便.本文提出挑选最具代表性的m个博文构成的博文集对博客兴趣建模,挑选的标准保证博文集中博文的重要性和主题多样性,并根据这两个指标来构造博文评估函数,将其转换成实例选择优化问题求解.实验以博客分类为目标,表明通过本文方法预处理后的博客,能够降低时间复杂度,提高分类准确率.

英文摘要:

With an exponential growth of the bloggers and the amount of information,there are more and more challenging about Information Retrieval and Knowledge Discover in blogosphere,which result in the inconveniences for subsequent blog data mining task.In this paper,we investigate a new problem of profiling a blog by choosing the m most representative entries from the blog.We proposed two principles: importance and diversity.We combine them into a objective function,formulate the entry selection program into a formal optimization task of instance selection.We evaluated the proposed entry selection algorithms by blog classification,our experiment results showed high classification accuracy and low Time complexity.

同期刊论文项目
期刊论文 13 会议论文 20
同项目期刊论文
期刊信息
  • 《小型微型计算机系统》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院沈阳计算技术研究所
  • 主编:林浒
  • 地址:沈阳市浑南新区南屏东路16号
  • 邮编:110168
  • 邮箱:xwjxt@sict.ac.cn
  • 电话:024-24696120 024-24696190-8870
  • 国际标准刊号:ISSN:1000-1220
  • 国内统一刊号:ISSN:21-1106/TP
  • 邮发代号:8-108
  • 获奖情况:
  • 中国自然科学核心期刊,中国科学引文数据库来源期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23212