位置:成果数据库 > 期刊 > 期刊详情页
一种基于流形学习的文档重排序方法
  • ISSN号:0253-2395
  • 期刊名称:《山西大学学报:自然科学版》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:湖南科技大学计算机科学与工程学院,湖南湘潭411201
  • 相关基金:国家自然科学基金(61300129); 湖南省教育厅资助科研项目(16K030); 湖南省研究生科研创新资助项目(CX2016B575); 教育部留学回国人员科研启动基金(教外司留[2013]1792)
作者: 赵文玉, 周栋
中文摘要:

对第一轮检索的结果文档进行重新排序,以提高顶端结果的准确率,一直是信息检索研究中的基础和关键热点问题。文章在考虑文档与文档的基础上,充分考虑了文档与关键词项以及词项与词项之间的多种关系,提出了一种基于流形学习的检索结果重排序的方法。将文档-文档,文档-关键词项,以及词项-词项这三种关系利用流形学习模型进行融合,然后通过正则化框架,在第一轮检索结果分数的基础上,进行文档重排序。在CLEF数据集上进行的实验表明,与基于图的文档重排序,基于LDA模型的文档重排序等方法相比,文中提出的方法可以更好地提高检索准确率。特别是在奥地利图书馆数据集中,采用MRR评估方法,文章所提出方法的准确率比表现最好的基线系统提高了11.78%,比第一轮检索结果提高了33.46%。

英文摘要:

Document re-ranking is one of hot research areas in Information Retrieval so as to improve precision of top-ranked documents based on the first round retrieval results.We take the relationships between documents,between words in documents,between documents and words into consideration and propose a manifold-learning method for document re-ranking.The method incorporate the relationships between documents,between words in documents,between documents and words by a manifold-learning model,and then integrate them into a normalized framework to re-rank documents based on the initial results.The experiments are conducted on CLEF dataset.Comparing with representative baselines such as those based on graphs or the LDA model,this method can better improve precision.The method achieves 11.78% higher precision than the best performed baseline and 33.48% higher precision than the initial ranking results measured by MRR in Austrian National Library dataset.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《山西大学学报:自然科学版》
  • 北大核心期刊(2011版)
  • 主管单位:山西省教育厅
  • 主办单位:山西大学
  • 主编:杨斌盛
  • 地址:太原市坞城路92号
  • 邮编:030006
  • 邮箱:xbbjb@sxu.edu.cn
  • 电话:0351-7010455
  • 国际标准刊号:ISSN:0253-2395
  • 国内统一刊号:ISSN:14-1105/N
  • 邮发代号:22-42
  • 获奖情况:
  • 边疆七年获山西省一级期刊荣誉(1993-1999)
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),英国动物学记录,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:5651