东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于查询日志分析的中文网页关键词抽取方法

ISSN号：1001-6600
期刊名称：《广西师范大学学报：自然科学版》
时间：0
分类：G356.6[文化科学—情报学] TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]福建师范大学协和学院,福建福州350117, [2]福建师范大学经济学院,福建福州350108
相关基金：国家社会科学基金资助项目（14CJL001）

关键词：查询日志, 关键词抽取, 关键短语组配, 同义词识别, 多义词消歧, query log, keyword extraction, keyphrase matching, synonym recognition, polysemy disambiguation

中文摘要：

以全文索引为基础的网页搜索引擎检索相关度偏低。针对这一问题，本文提出了一种基于查询日志分析的中文网页关键词抽取方法。该方法利用用户对网页与查询词的相关性判断来选择关键词。为了量化用户的相关性判断，提出了单位篇幅停留时间、逆向点击率、排名补偿因子3个指标，并对其进行综合加权。在查询串分词、同义词识别及多义词消歧、关键短语组配方面，也做了特殊处理。实验结果表明：抽取关键词的准确率较高，综合性能也高于TF．IDF和SVM方法。该方法能得到较满意的关键词抽取效果。

英文摘要：

The webpage search engine based on the full-text index provides low correlation. To solve this problem, this paper proposes a keyword extraction method for Chinese pages based on query log analysis. The method selects keywords according to users＇ judgment of relevance on the page and query words. In order to quantify the relevance judgment, three indexes, such as residence time per unit length, inverted click rate and rank compensation factor, are proposed of which are then comprehensively weighted. In this paper, these processes, such as query string segmentation, synonym recognition, polysemy disambiguation, keyphrase matching, are specially treated. The experiment results show that the precision rate is high, and the comprehensive performance is better than that of the TF.IDF method and the SVM method. The proposed method can obtain satisfactory effect of the keyword extraction.

同期刊论文项目

　我国省域创新驱动发展的效率评价与路径选择研究

期刊论文 12

同项目期刊论文

我国制造业与物流业联动发展效率评价——基于超效率CCR-DEA模型

中国省域流通效率及其影响因素研究——基于空间统计及空间计量分析

中国自贸试验区积极融入“一带一路”建设研究——内涵、基础、实践及路径探讨

创新驱动发展的模式及路径选择：美、德、日的比较与借鉴

福建省创新驱动发展能力的区域差异及影响因素——基于熵值法的视角

福建省流通产业碳排放影响因素实证研究——基于Tapio弹性脱钩理论和LMDI分解法

基于共生度模型的长江经济带制造业与物流业协同发展研究

供给侧改革下的银行定位与支持路径

集聚与二氧化碳排放的空间交互作用——基于空间联立方程的实证研究

四地自贸试验区建设的比较研究：共性、个性及着力点

中国省域流通产业发展的时空格局分析

期刊信息

《广西师范大学学报：自然科学版》
北大核心期刊（2011版）

主管单位:广西师范大学
主办单位:广西师范大学
主编：苏桂发
地址：桂林市三里店育才路15号
邮编：541004
邮箱：gxsdzkb@mailbox.gxnu.edu.cn
电话：0773-5848958

国际标准刊号：ISSN：1001-6600
国内统一刊号：ISSN：45-1067/N
邮发代号:48-54

获奖情况:
1994年，获广西优秀期刊三等奖,1995年，获广西高校理科学报B类一等奖,1996年，获广西第三届优秀报刊二等奖,1999年，获广西首届高校优秀学报二等奖,2001年，被评为第四届广西优秀科技期刊,2002年，获第二届广西高校优秀学报二等奖,2002年，入选中国期刊方阵“双效”期刊,2004年，获全国高校优秀科技期刊一等奖,2005年，获第五届“广西十佳自然科学期刊”称号,2007年，获第六届“广西十佳自然科学期刊”称号,2008年，被评为全国高校科技期刊先进集体

国内外数据库收录:
俄罗斯文摘杂志,美国化学文摘（网络版）,英国农业与生物科学研究中心文摘,波兰哥白尼索引,德国数学文摘,美国剑桥科学文摘,英国动物学记录,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）

被引量:5888