位置:成果数据库 > 期刊 > 期刊详情页
高性能网页索引器JU_Indexer的实现
  • ISSN号:1671-5489
  • 期刊名称:《吉林大学学报:理学版》
  • 时间:0
  • 分类:TP393.09[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]吉林大学计算机科学与技术学院,长春130012, [2]吉林大学符号计算与知识工程教育部重点实验室,长春130012
  • 相关基金:国家自然科学发展项目基金(批准号:60373099)
中文摘要:

高性能网页索引器JU—Indexer用倒排索引表存储网页索引数据,以多线程并行的方式对网页建立索引数据,采用经过优化的检索算法实现用户的查询.首先给出了JU—Indexer的系统框架,然后描述了索引数据在JU—Indexer中的存储结构、建立网页索引的算法、以及实现用户查询的检索算法.实验结果表明,JU—Indexer能在毫秒级的时间内完成用户的查询,它采用的经过优化的词组检索算法缩短了词组的检索时间.

英文摘要:

JU_Indexer, a web page indexer with high performance, uses the inverted index table to store index data for web pages, creates index data by multiple threads concurrently, utilizes the optimized search algorithms to implement the queries posed by users. First, the system architecture of JU_Indexer is given. Then, the data structure used to store the index data in JU Indexer, the algorithm employed to create web page index, and the strategy utilized to complete the queries proposed by users are described in great detail. The experiment result demonstrates that the queries proposed by users can be completed by JU_Indexer within milliseconds. The optimized phrase search algorithm employed by JU_Indexer shortens the time to complete the phrase querying.

同期刊论文项目
期刊论文 39 会议论文 21
同项目期刊论文
期刊信息
  • 《吉林大学学报:理学版》
  • 北大核心期刊(2011版)
  • 主管单位:教育部
  • 主办单位:吉林大学
  • 主编:裘式纶
  • 地址:长春市南湖大路5372号
  • 邮编:130012
  • 邮箱:sejuj@mail.jlu.edu.cn
  • 电话:0431-88499428
  • 国际标准刊号:ISSN:1671-5489
  • 国内统一刊号:ISSN:22-1340/O
  • 邮发代号:12-19
  • 获奖情况:
  • 在吉林省、教育部及全国优秀科技期刊评比中共获奖1...,2008年被评为"中国精品科技期刊", 并获教育部"第...,2009年获全国高校科技期刊优秀编辑质量奖,并被吉...,2008年和2009年连续两次获"中国科技论文在线优秀期...,2010年获教育部"第三届中国高校优秀科技期刊"奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:6314