位置:成果数据库 > 期刊 > 期刊详情页
挖掘用户浏览网页的兴趣研究
  • ISSN号:1003-3254
  • 期刊名称:计算机系统应用
  • 时间:0
  • 页码:65-68+109
  • 分类:TP393.092[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]上海理工大学管理学院,上海200093
  • 相关基金:国家自然科学基金(70971089); 上海市重点学科建设项目(S30501)
  • 相关项目:基于网页浏览记录的人类动力学与协同兴趣网络研究
作者: 曹易|张宁|
中文摘要:

通过挖掘网页的浏览记录来对用户群体兴趣进行分析。对访问网站的兴趣类别、时间、用户数进行统计,得到规律性的结论。其次提出一种改进的基于HAC和k-means的算法对用户根据兴趣进行聚类,挖掘用户的访问模式。最后验证了主导兴趣的稳定性即随着日志的增加,用户的最大兴趣是趋于稳定的。

英文摘要:

This paper analyses the users’ group interests by mining the internet browsing history.To count the visiting information of the interests’ categories,visiting time and the number of users,get the regularity of conclusion.Then,it has put forward an improved HAC(hierarchical agglomerative clustering) and k-means algorithm to cluster the users by their interests,to mine the users’ access mode.Finally,it has proved the stability of users’ dominant interests.That means the users’ most important interests are stable as the time increases.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机系统应用》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院软件研究所
  • 主编:苏振泽
  • 地址:北京8718信箱
  • 邮编:100190
  • 邮箱:csa@iscas.ac.cn
  • 电话:010-62661041
  • 国际标准刊号:ISSN:1003-3254
  • 国内统一刊号:ISSN:11-2854/TP
  • 邮发代号:82-558
  • 获奖情况:
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2000版)
  • 被引量:15201