位置:成果数据库 > 期刊 > 期刊详情页
科技论文关键词特征及其对共词分析的影响
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:H152.3[语言文字—汉语]
  • 作者机构:[1]武汉大学信息资源研究中心,武汉430072
  • 相关基金:本文系国家自然科学基金资助项目“数字图书馆社区的知识聚合与服务研究”(项目编号:71273197)的研究成果之一.
中文摘要:

针对传统共词分析中高频词共现矩阵的构建方法提出了一些疑问,包括:抽取高频词作为分析对象的可靠性、高频词矩阵对领域内重要共现关系的保留程度、关键词的语义类型特征和关键词缺失可能带来的影响。通过实证数据揭示了科技论文的关键词词频、共现关系、语义类型的分布特征,并分析了它们对共词分析方法的影响,包括:基于关键词的共词分析只能分析热门知识节点,共词网络实质上是建立在不稳定的单次关联基础之上,而高频词矩阵则会丢失大量重要的共现关系,这些问题是由关键词的语义类型特征决定的,该特征是实现词语间差异化乃至语义化处理的重要切入点。另外,本文在对比关键词增补前后的共词矩阵后发现,增补关键词实质上无法优化高频词矩阵对所分析领域的代表性。在结尾部分,提出了两种可尝试的思路:一是结合关键词频次和共现关系强度抽取分析对象;二是以关键词语义类型为维度构建多维共现矩阵以更好地挖掘多种语义关联。

英文摘要:

This paper raises some doubts about the traditional co-word analysis methods, including the reliability of high-frequency keywords extraction, the retention rate of important co-occurrence relations in the high-frequent word matrix, the possible impact of keyword' s semantic feature and missing keywords. Through the analysis of a real scientific publication dataset, we revealed its word frequency distribution, co-occurrence distribution and semantic feature. We also find their impacts on co-word analysis, including: keywords-based co-word analysis can only show the research hotspots and relations among them; nearly a half of the important co-occurrence relations is lost if only using high-frequent keywords to generate matrix ; the semantic information of keyword could be an important feature for the differentiation and semantization of keywords. Considering additional keywords from publication title cannot help to improve the representativeness of the high-frequent word matrix to the whole knowledge network. In the conclusion, we propose two possible methods for improvement: one is to select keywords by combining their frequency and intensity of co-occurrence relationship; the other is to construct multi-dimensional co-occurrence matrix in order to differentiate multiple semantic associations.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778