位置:成果数据库 > 期刊 > 期刊详情页
基于多维尺度模型的潜在主题可视化研究
  • ISSN号:1000-0135
  • 期刊名称:情报学报
  • 时间:2014.1.15
  • 页码:45-54
  • 分类:F614[经济管理—产业经济]
  • 作者机构:[1]武汉大学信息资源研究中心,武汉430072, [2]美国威斯康辛大学密尔沃基分校信息研究学院,密尔沃基53211, [3]湖北省科技厅,武汉430071
  • 相关基金:国家建设高水平大学公派研究生项目(留金发[2011]3005);国家自然科学基金(71173249).
  • 相关项目:知识网络的形成机制及演化规律研究
中文摘要:

数据库内容结构分析把共词分析方法应用于全文主题发现,但事先选定种子词和统计共现次数等步骤导致该方法会遗漏很多重要的词汇组合和潜在主题。本文提出使用词汇集聚理论作为潜在主题可视化的理论基础,跳过事先选定种子词和统计共现矩阵的步骤,把词条表示在转置的向量空间中,通过多维尺度模型(MDS)算法把词条在转置向量空间中的邻近关系投影到三维空间图上,通过词汇的空间聚类来发现和表示潜在主题;引入数据编码的方法来克服MDS可视空间容量的局限,并设计了邻近矩阵、质心邻近矩阵、属性叠加邻近矩阵及三个层次的方法流程。最后,成功地将三个层次的潜在主题可视化的方法流程应用于计算机应用服务业上市公司的风险识别。

英文摘要:

Database Tomography analysis applied term co-occurrence method to discover topics in full texts. But it may miss lots of content and topics in the original text set because of its procedure of co-occurrence frequency statistic and pre-selection of seed term. This paper propose to regard lexical cohesion as theoretical basis of underlying topics visualization, skipping the steps of co-occurrence frequency statistic and pre-selection of seed term, to present terms in transposed vector space, to map the proximity of terms in transposed vector space to visual space by Multi-Dimensional Scale (MDS) algorithm, and to discover and present topics by spatial clustering of related terms. Data coding method was introduced to overcome the limitations of MDS visual space area. Terms proximity matrix, centroid proximity matrix, attribute accumulative proximity matrix and according method procedures were developed to construct a three layers method system. Method of underlying topics visualization was successfully applied to do risk identification for public companies of computer application services, using verbal content about risk factor in prospectus as texts collection.

同期刊论文项目
期刊论文 60 会议论文 20 著作 1
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778