位置:成果数据库 > 期刊 > 期刊详情页
构建查询需求形式分类体系
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:2012.11.11
  • 页码:117-120
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1] 智能技术与系统国家重点实验室,北京100084, [2] 清华信息科学与技术国家实验室,北京100084, [3] 清华大学计算机系,北京100084
  • 相关基金:国家863高科技项目(2011AA01A205),自然科学基金(60903107,61073071)
  • 相关项目:网络信息检索用户行为可靠性分析关键技术研究
中文摘要:

各大搜索引擎公司都致力于准确而快速的帮助用户找到信息目标,搜索性能评价变得非常重要,而目前尚无对长尾查询性能评价的方法.该文通过分析长尾查询结果数据,提取了长尾查询三种类型特征,并对特征进行叠加分析.进一步地针对数据集的严重不平衡问题提出两种数据平衡方法.最后提出并改进了长尾查询评价方法.在真实搜索引擎结果数据集上的实验验证了所提出的评价方法取得一定的评价效果,其中对不相关文档的评价取得较高的准确率.

英文摘要:

Search engines are committed to helping people find target information accurately and quickly, hence the e- valuation of search performance becomes more vital, This paper deals with the rare queries performance evaluation which is less touched. First, three types of features are extracted after analyses of rare queries characteristics. Sec- ond, correlation of the fealures is analyzed and different combinations of features are tested. Then, two data balan- cing approaches are raised to alleviate the serious imbalance of the data set. Finally the evaluation method for rare queries is put forward and then improved. The experimental results show that the proposed evaluation approach is effective, by which the identification of non-relevant results achieves encouraging precision.

同期刊论文项目
期刊论文 30 会议论文 35 专利 10
期刊论文 49 会议论文 19 获奖 1 著作 1
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136