位置:成果数据库 > 期刊 > 期刊详情页
一种文本数据挖掘与可视化的新方法
  • ISSN号:1002-3208
  • 期刊名称:《北京生物医学工程》
  • 时间:0
  • 分类:R318.04[医药卫生—生物医学工程;医药卫生—基础医学]
  • 作者机构:[1]清华大学,北京100084, [2]北京林业大学,北京100083
  • 相关基金:教育部重点项目(104232)、教育部跨世纪人才基金、国家自然科学基金(90412018)、清华裕元医学科学研究基金资助
中文摘要:

传统搜索引擎的搜索结果采用的是以一维列表的形式展现,随着文献数据的急剧增多,用户对于搜索结果的辨识和分析速度也在急剧下降。为了弥补传统工具的这一不足,本文开发了“语义图”(semanticmap,SMAP),此工具对文献数据进行数据挖掘和可视化,包括关联匹配和聚类,将搜索结果以二维矩阵图的形式展示出来,方便用户理解数据之间的内部联系,并帮助用户迅速从整体上把握搜索结果。最后以蛋白质组学文献分析过程为例具体展示了此工具的应用。

英文摘要:

The results of traditional search engine technologies are currently shown as one-dimensional list. With the explosion of publication data, users get rapid slowdown on the cognition of the results. Hence we were motivated to develop a novel method of literature data mining and visualization called semantic map(SMAP) , utilizing data mining tech- niques and visualization, including association matching and clustering, etc. A semantic map is shown as a two-dimensional array image to reveal the inner relations of data, and could help users quickly grasp the entire results from whole data. Finally, literature data of proteomics was analyzed, which was a good example of applying SMAP.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《北京生物医学工程》
  • 中国科技核心期刊
  • 主管单位:北京市卫生和计划生育委员会
  • 主办单位:北京市生物医学工程学会 北京市心肺血管疾病研究所
  • 主编:孙衍庆
  • 地址:北京安定门外安贞医院北京生物医学工程编辑部
  • 邮编:100029
  • 邮箱:LLBL910219@126.com
  • 电话:010-64456508
  • 国际标准刊号:ISSN:1002-3208
  • 国内统一刊号:ISSN:11-2261/R
  • 邮发代号:82-885
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:5449