位置:立项数据库 > 立项详情页
LINK SPAM技术的研究及相关算法在海量真实WEB数据上的有效性验证
  • 项目名称:LINK SPAM技术的研究及相关算法在海量真实WEB数据上的有效性验证
  • 项目类别:青年科学基金项目
  • 批准号:60603042
  • 申请代码:F020204
  • 项目来源:国家自然科学基金
  • 研究期限:2007-01-01-2009-12-31
  • 项目负责人:王轶彤
  • 负责人职称:副教授
  • 依托单位:复旦大学
  • 批准年度:2006
中文摘要:

Internet和WEB搜索引擎的发展正迅速改变着这个世界:不仅影响着人们日常生活和购物的习惯,并且蕴涵着巨大的商机。对许多个人或是公司来说如何能在上百亿的海量WEB数据中被搜索引擎排序在前列成为至关重要。由此Web Spamming现象和技术就产生了人为地使某些网页得到其不应该得到的高排序值。Web Spamming严重地影响了WEB搜索引擎的性能和检索结果的质量,被称为未来WEB搜索引擎研究所面临的最大的挑战之一。本项目正是对Web Spamming中最重要的,今后占主导地位的Link Spam进行研究,主要内容包括1)对SPAM网页和Link Spam结构进行统计分析和结构分析;2)通过基于链接分析的聚类算法来识别Link Spam的核心结构;3)提出基于图近似匹配和决策树的高效识别算法以及多层次应对算法;4)在海量真实Web数据上验证提出算法的有效性并和目前的启发式算法进行比较


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 3
  • 3
  • 0
  • 0
  • 0
相关项目
期刊论文 15 会议论文 1 获奖 4 专利 3
期刊论文 3 会议论文 4 获奖 1
期刊论文 12 会议论文 4
王轶彤的项目