位置:成果数据库 > 期刊 > 期刊详情页
基于用户行为分析的个人信息检索研究
  • ISSN号:1003-0077
  • 期刊名称:《中文信息学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院计算技术研究所,北京100190, [2]中国科学院研究生院,北京100049
  • 相关基金:国家自然科学基金资助项目(60873166 60776797); 国家973计划资助项目(2007CB311103); 国家863计划资助项目(2006AA010105)
中文摘要:

个人信息检索是指个人计算机上用户搜索个人信息(通常是文档)的过程,与互联网检索相比,个人信息检索能够利用的信息很少,这使得其检索结果的排序更加困难。该文通过考察计算机上的用户行为,对个人信息检索的排序问题进行深入的研究。该文考察的用户行为主要包括用户在检索系统中的查询行为和在计算机上的文件访问行为。该文一方面通过查询行为数据训练出结果排序函数,另一方面通过文件访问行为数据获取文件自身的权重,最后利用统计学习方法结合这两类行为的计算结果。实验结果表明,该文提出的方法好于传统的TFIDF排序方法。

英文摘要:

Personal Information Retrieval(PIR) is an important technology for users searching files in their computers.Compared with Web retrieval,the information that can be used by PIR are very limited,which makes personal information retrieval a very difficult problem.In this paper,we collect user behavior information and use them to conduct an in-depth research on ranking problem of PIR.The user behavior information includes the user's search information and the file-access information.In this paper,we use search information to obtain training data and file-access information to computer file weights,then we use statistical learning method to learn ranking function.Experimental results show that our method performes better than the traditional TFIDF ranking method.

同期刊论文项目
期刊论文 4 会议论文 8 专利 1
期刊论文 8 会议论文 14
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136