位置:成果数据库 > 期刊 > 期刊详情页
代价敏感的列表排序算法
  • ISSN号:1000-1239
  • 期刊名称:计算机研究与发展
  • 时间:2012
  • 页码:1738-1746
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术] TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]南开大学信息技术科学学院,天津300071, [2]南开大学软件学院,天津300071
  • 相关基金:高等学校博士学科点专项科研基金项目(20100031110096);中央高校基本科研业务费专项基金项目(65010571);国家自然科学基金项目(61105049)
  • 相关项目:基于深度学习的结构化预测模型研究
中文摘要:

排序学习是信息检索与机器学习中的研究热点之一.在信息检索中,预测排序列表中顶部排序非常重要.但是,排序学习中一类经典的排序算法一一列表排序算法——无法强调预测排序列表中顶部排序.为了解决此问题,将代价敏感学习的思想融入到列表排序算法中,提出代价敏感的列表排序算法框架.该框架是在列表排序算法的损失函数中对文档引入权重,且基于性能评价指标NDCG计算文档的权重.在此基础之上,进一步证明了代价敏感的列表排序算法的损失函数是NDCG损失的上界.为了验证代价敏感的列表排序算法的有效性,在此框架下提出了一种代价敏感的ListMLE排序算法,并对该算法开展序保持与泛化性的理论研究工作,从理论上验证了该算法具有序保持特性.在基准数据集上的实验结果表明,在预测排序列表中顶部排序中,代价敏感的ListMLE比传统排序学习算法能取得更好的性能.

英文摘要:

Learning to rank is a popular research area in machine learning and information retrieval (IR). In IR, the ranking order on the top of the ranked list is very important. However, listwise approach, a kind of classical approach in learning to rank, cannot emphasize the ranking order on the top of the ranked list. To solve the problem, the idea of cost-sensitive learning is brought into the listwise approach, and a framework for cost-sensitive listwise approach is established. The framework imposes weights for the documents in the listwise loss functions. The weights are computed based on evaluation measure. Normalized Discounted Cumulative Gain (NDCG). It is proven that the losses of cost-sensitive listwise approaches are the upper bound of the NDCG loss. As an example, a cost- sensitive ListMLE method is proposed. Moreover, the theoretical analysis is conducted on the order preservation and generalization of cost-sensitive ListMLE. It is proven that the loss function of cost- sensitive ListMLE is order preserved. Experimental results on the benchmark datasets indicate that the cost-sensitive ListMLE achieves higher ranking performance than the baselines on the top of the ranked list.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机研究与发展》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院计算技术研究所
  • 主编:徐志伟
  • 地址:北京市科学院南路6号中科院计算所
  • 邮编:100190
  • 邮箱:crad@ict.ac.cn
  • 电话:010-62620696 62600350
  • 国际标准刊号:ISSN:1000-1239
  • 国内统一刊号:ISSN:11-1777/TP
  • 邮发代号:2-654
  • 获奖情况:
  • 2001-2007百种中国杰出学术期刊,2008中国精品科...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:40349