位置:成果数据库 > 期刊 > 期刊详情页
基于属性约简的粗糙集海量数据分割算法研究
  • ISSN号:1673-629X
  • 期刊名称:《计算机技术与发展》
  • 时间:0
  • 分类:TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]南京邮电大学计算机学院,江苏南京210003, [2]南京大学计算机软件新技术国家重点实验室,江苏南京210093
  • 相关基金:国家自然科学基金(60973139;60773041);江苏省自然科学基金(BK2008451);国家高科技863项目(2007AA012404;2007AA017.478);现代通信国家重点实验室基金(9140C1105040805);国家和江苏省博士后基金(0801019C;20090451240;20090451241);江苏高校科技创新计划项目(CX08B-086Z);江苏省六大高峰人才项目(2008118);江苏省青蓝工程资助项目
中文摘要:

结合Rough Set理论研究了分布式处理海量数据中的关键问题,即分割海量数据集的问题。经典的RoughSet算法要求数据常驻内存,因此不能有效地处理海量数据。为了能够直接处理海量数据集,根据最佳分割的定义,结合属性约简的思想,提出基于属性约简的粗糙集海量数据分割算法(Mass Data Partition for Rough Seton Attribute Reducdon,MD-PRS—AR)。通过实验表明,MDPRS—AR算法的分割效率比传统的算法约高70%,而且与处理整个数据集的算法相比,正确性损失不大。

英文摘要:

An effective rough-set-based method is developed to study the key problem of process distributed mass data, which is the problem of segment massive dataset. Most other rough- set - based algorithms are designed only for memory- resident data, so it is hard for these algorithms to deal with mass data set. On the base of definition of best partition, and combined with the idea of attribute reduction, a mass data partition for rough set on attribute reduction algorithm is developed for processing mass data sets directly. It is proved by simulation experiments that the MDPRS- AR method presented is faster than original rough- set- based algorithms by about 70%, while its performance is close to those algorithms that process the original data set as a whole.

同期刊论文项目
期刊论文 188 获奖 2 专利 44 著作 5
同项目期刊论文
期刊信息
  • 《计算机技术与发展》
  • 中国科技核心期刊
  • 主管单位:陕西省工业和信息化厅
  • 主办单位:陕西省计算机学会
  • 主编:王守智
  • 地址:西安市雁塔路南段99号
  • 邮编:710054
  • 邮箱:ctad@vip.163.com
  • 电话:029-85522163
  • 国际标准刊号:ISSN:1673-629X
  • 国内统一刊号:ISSN:61-1450/TP
  • 邮发代号:52-127
  • 获奖情况:
  • 《CAJ-CD规范》执行优秀期刊
  • 国内外数据库收录:
  • 中国中国科技核心期刊
  • 被引量:21263