位置:成果数据库 > 期刊 > 期刊详情页
领域本体构建与可视化展示研究
  • ISSN号:1000-7490
  • 期刊名称:情报理论与实践
  • 时间:2012.10.10
  • 页码:95-98
  • 分类:TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]武汉大学信息资源研究中心,湖北武汉430072
  • 相关基金:本文为教育部博士研究生学术新人奖(项目编号:5052012104001)和国家自然科学基金项目(项目编号:71073121)的研究成果之一.
  • 相关项目:企业竞争情报智能分析模型与方法研究
中文摘要:

针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法。该算法利用基于种子一扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题。实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性。

英文摘要:

As for the semantic loss and semantic shortage problems in the traditional Chinese text semantic feature extraction algorithm, this paper designs a Chinese text semantic feature extraction algorithm in combination with domain ontology. The algo rithm utilizes the keyword identification and extraction algorithm based on seedexpansion mechanism to solve the semantic loss prob lem in the traditional algorithm which utilizes the word segmentation tool to extract the keywords, and utilizes the text concept feature semantic mapping and aggregation algorithm based on domain ontology to solve the high dimension and semantic shortage problem in the traditional algorithm which utilizes the vector space model to represent the text. The experiment results show that this algorithm has achieved a very good anticipated effect and can improve the depth and accuracy of the text feature extraction dramatically.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报理论与实践》
  • 北大核心期刊(2011版)
  • 主管单位:中国兵器工业集团公司
  • 主办单位:中国国防科学技术信息学会 中国兵器工业集团第二一零研究所中国兵器工业第二一0研究所
  • 主编:王忠军
  • 地址:北京2413信箱10分箱
  • 邮编:100089
  • 邮箱:ita@onet.com.cn
  • 电话:010-68961793 68963306
  • 国际标准刊号:ISSN:1000-7490
  • 国内统一刊号:ISSN:11-1762/G3
  • 邮发代号:82-436
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国人文社科核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:26785