位置:成果数据库 > 期刊 > 期刊详情页
基于链接结构分析的主题搜索
  • ISSN号:0254-0037
  • 期刊名称:《北京工业大学学报》
  • 时间:0
  • 分类:TP182[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]北京航空航天大学经济管理学院,北京100191, [2]The Rawls College of Business Administration, Texas Tech University, TX 79410, USA
  • 相关基金:国家自然科学基金资助项目(70671007)
中文摘要:

针对目前一般文本搜索引擎采用的关键词匹配方法导致搜索效率相对低下的问题,在分析语义相关性的度量方案基础上,利用Wikipedia丰富链接结构所蕴涵信息,提出基于链接结构分析的主题搜索策略.设计了词条相关性算法,用以描述词间距离,并对词条进行相关度的重新排序.实验中引入用户评价机制,并与传统策略搜索结果进行对比.结果证明,该策略在扩大主题覆盖度的同时保证了较高的用户意图识别度.

英文摘要:

Current text search engines always have low search efficiency due to their keyword matching method.Based on the comparison of previous works,a thematic search strategy is proposed.The main idea of this strategy is grounded on the rich information implicated by the link structure of Wikipedia.It defines a measure of distance between words in terms of DBW,underpinned by computational thematic communities model.In this way,the authors can use this algorithm to rank and reorient the Key words to discover the closest keyword clusters and improve the quality of searching result.Introducing users' appraisal mechanism and making comparison with the traditional search engines' outcomes in experiment prove that the strategy expands the thematic coverage and maintains a high users' intent recognition at the same time.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《北京工业大学学报》
  • 中国科技核心期刊
  • 主管单位:北京市教委
  • 主办单位:北京工业大学
  • 主编:卢振洋
  • 地址:北京市朝阳区平乐园100号
  • 邮编:100124
  • 邮箱:xuebao@bjut.edu.cn
  • 电话:010-67392535
  • 国际标准刊号:ISSN:0254-0037
  • 国内统一刊号:ISSN:11-2286/T
  • 邮发代号:2-86
  • 获奖情况:
  • 中国高等学校自然科学学报优秀学报二等奖,北京市优秀期刊,华北5省市优秀期刊,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:11924