位置:成果数据库 > 期刊 > 期刊详情页
基于查询聚类的排序学习算法
  • ISSN号:1003-6059
  • 期刊名称:模式识别与人工智能
  • 时间:0
  • 页码:118-123
  • 分类:TP391.3[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]智能技术与系统国家重点实验室,北京100084, [2]清华信息科学与技术国家实验室(筹),北京100084, [3]清华大学计算机科学与技术系,北京100084
  • 相关基金:国家自然科学基金(No.60736044 60903107 61073071); 高等学校博士学科点专项科研基金(No.20090002120005)资助项目
  • 相关项目:基于网络用户行为分析的垃圾网页识别方法研究
中文摘要:

排序学习算法作为信息检索与机器学习的一个交叉领域,越来越受到人们的重视.然而,几乎没有排序学习算法考虑到查询差异的存在.文中查询被建模为多元高斯分布,KL距离被用来度量查询之间的距离,利用谱聚类方法对查询进行聚类,为每个聚类类别训练一个排序函数.实验结果表明经过聚类得到的排序函数需要较少的训练样例,但是它的性能却和没有经过聚类得到的排序函数具有可比性,甚至优于后者.

英文摘要:

Learning to rank,the interdisciplinary field of information retrieval and machine learning,draws increasing attention and lots of models are designed to optimize the ranking functions.However,few methods take the differences among the queries into account.In this paper,the queries are modeled as multivariate Gaussian distributions and Kullback-Leibler divergence is adopted as distance measure.The spectral clustering is applied to cluster the queries into several clusters and a ranking function is learned for each cluster.The experimental results show that the ranking functions with clustering are trained with less data,but are comparable to or even outperform the ones without clustering.

同期刊论文项目
期刊论文 117 会议论文 76 专利 12 著作 3
期刊论文 49 会议论文 19 获奖 1 著作 1
期刊论文 30 会议论文 35 专利 10
同项目期刊论文
期刊信息
  • 《模式识别与人工智能》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会 中国自动化学会
  • 主办单位:国家智能计算机研究开发中心 中国科学院合肥智能机械研究所
  • 主编:郑南宁
  • 地址:安徽省合肥市蜀山湖路350号中国科学院合肥智能机械研究所
  • 邮编:230031
  • 邮箱:bjb@iim.cas.cn
  • 电话:0551-5591176
  • 国际标准刊号:ISSN:1003-6059
  • 国内统一刊号:ISSN:34-1089/TP
  • 邮发代号:26-69
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:10169