位置:成果数据库 > 期刊 > 期刊详情页
持久偏爱的Web用户访问路径信息挖掘方法
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:G250.76[文化科学—图书馆学]
  • 作者机构:[1]大连理工大学系统工程研究所,大连116024, [2]东北财经大学,大连116023
  • 相关基金:国家自然科学基金项目(70671016)资助.
中文摘要:

现有的Web用户访问路径信息发现方法大都着眼于从静态的Web日志快照中进行挖掘。本文力图从Web访问数据的历史演变过程中,发现新的知识——持久偏爱的Web用户访问路径PP-WAP。PP-WAP实际上是历史访问序列WAS中大部分时间支持度值波动很小且保持较高的访问路径信息。本文首先介绍了相关背景和PP-WAP的应用领域。接下来,利用无序树结构来表示历史WAS集合,同时给出了PP—WAP的定义和挖掘算法描述。最后,分别针对模拟和实际数据集对算法的可扩展性以及PP-WAP的应用价值作了实验分析。

英文摘要:

Existing Web access path mining techniques focus only on discovering knowledge from the static snapshot of Web log data. This paper tries to discover new knowledge--PP-WAP (persistent and preferred Web users' access paths) from dynamic nature of historical Web access data. These PP-WAPs are actually access paths whose support values keep higher and have fewer fluctuations in the historical Web access sequences (WAS). Firstly, the background and applications of PP-WAPs are introduced in this paper. Secondly, this paper adopts unordered tree structure to represent historical WAS sets and then presents the detailed definition and mining algorithm description of PP-WAP. Finally, according to simulation dataset and real dataset, this paper respectively conducts experiments to analyze the scalability of the algorithm and application value of PP-WAP.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778