位置:成果数据库 > 期刊 > 期刊详情页
TFC-Reducing:一种基于属性语义距离和规则的文本型形式背景约简方法
  • ISSN号:1000-1220
  • 期刊名称:《小型微型计算机系统》
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国人民大学信息学院,北京100872, [2]怀化学院数学与应用数学系,湖南怀化418008
  • 相关基金:国家自然科学基金项目(70871115)资助
中文摘要:

形式概念分析作为数据分析和知识处理的形式化工具,可以有效的从海量文本数据中挖掘出人们感兴趣的知识,受到许多研究人员的推崇.形式概念分析的前提条件是必须有一个纯净、良好定义的形式背景.从文本中直接提取特征词,利用文本-特征词形成的文本型形式背景(Textual Formal Context TFC)是一个高度稀疏的二维表,带有很多的噪音信息,严重影响形式概念分析的建格效率以及概念格的结构.因此找到一种有效的文本型形式背景约简方法很有必要.本文综合考虑文本型形式背景的本质特征,从属性语义距离和数学原理出发,提出了一种文本型形式背景的约简方法TFC-Reducing,并给出文本型形式背景约简的评价方法--信息损失熵和语义覆盖度.

英文摘要:

As a tool of data analysis and formalizing for knowledge management, Formal Concept Analysis ( FCA ) can effective mine knowledge interested for people from lager textual data, and which are held in esteem by many researchers. The premise of FCA is that need a pure and well defined formal context. Extracting characteristic word directly from the text and exploiting document with characteristic words to form textual formal context ( TFC ), which lead to generating a highly sparse two-dimensional table with a lot of noise. It seriously affects efficiency of building concept lattice and the structure of lattice. Therefore, it is necessary to find an effective method for reducing the textual formal context. Comprehensively considering the nature of textual formal context in this paper, we propose a method named TFC-Reducing for the reduction of textual formal context from the view of semantic distance between attributes and mathematical theory, and give a method for evaluating reduction of textual formal context, named as information losses entropy ILE and semantic coverage SC.

同期刊论文项目
期刊论文 15 会议论文 17
同项目期刊论文
期刊信息
  • 《小型微型计算机系统》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院沈阳计算技术研究所
  • 主编:林浒
  • 地址:沈阳市浑南新区南屏东路16号
  • 邮编:110168
  • 邮箱:xwjxt@sict.ac.cn
  • 电话:024-24696120 024-24696190-8870
  • 国际标准刊号:ISSN:1000-1220
  • 国内统一刊号:ISSN:21-1106/TP
  • 邮发代号:8-108
  • 获奖情况:
  • 中国自然科学核心期刊,中国科学引文数据库来源期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23212