位置:成果数据库 > 期刊 > 期刊详情页
面向用户互联网访问日志的异常点击分析
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:44-48
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]智能技术与系统国家重点实验室、清华信息科学与技术国家实验室(筹)、清华大学计算机科学与技术系,北京100084
  • 相关基金:国家自然科学基金项目资助(60736044,60903107);高等学校博士学科点专项科研基金资助(20090002120005)
  • 相关项目:下一代信息检索研究
中文摘要:

随着互联网用户人数的日益增长,用户行为分析已经成为互联网技术领域重要的研究方法之一。在日志中去除异常点击,对于准确挖掘用户行为的意图和习惯十分重要。该文采用某公司提供的真实用户互联网访问日志,对日志中的连续点击,单IP多用户以及单用户多IP等可能的异常点击,从访问集中度,用户平均访问量等方面进行了分析。我们认为对于连续点击,用户行为分析研究人员可以分情况滤去多余点击或该用户所有点击,而对于单IP多用户和单用户多IP的点击,我们建议不做处理。

英文摘要:

Nowadays, user behavior analysis has been widely used in Web research fields. Therefore, how to remove abnormal clicks from Web user access logs is very important for extracting true information on user purpose and behavior. In this paper, with real world Web User Access Logs provided by a commercial search engine company ,we analyze some possible abnormal clicks--such as continuous click, one user many IPs, one ip many users, from some perspectives--for the degree of concentration for user to access web sites, average daily clicks of one user, etc. We suggest that for continuous click, user behavior researcher can eliminate superfluous and repetitive clicks or all the clicks of the user with continuous click, and the cases of one ip many users and one user many ips can be left untouched.

同期刊论文项目
期刊论文 117 会议论文 76 专利 12 著作 3
期刊论文 49 会议论文 19 获奖 1 著作 1
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136