关联规则数据挖掘是在数据记录的数据项之间进行关联分析,两种常用方法是基于Apriori算法的挖掘方法和基于粗糙集理论的挖掘方法。基于Apriori算法的关联规则挖掘分为二阶段频繁项集的挖掘和关联规则的生成,挖掘频繁项集是核心。基于粗糙集理论的关联规则挖掘主要包括属性约简和规则提取。属性约简是关键。中国营养健康信息化工程是由国家发改委公众营养与发展中心在2009年首届中国营养健康教育高峰论坛上启动的,旨在建立营养数据,给出科学营养方案。本项目拟用关联规则数据挖掘方法研究营养健康信息化模型1.改进基于矩阵的频繁集挖掘算法和基于辨识矩阵的属性约简算法;2.用两种改进算法建立基于关联规则数据挖掘的营养健康信息化模型:首先用粗糙集的属性约简算法进行属性约简,然后用改进的Apriori算法进行关联规则挖掘;3.基于关联规则数据挖掘的营养健康信息化模型对确定总体的简单随机样本进行关联规则数据挖掘。
Association rules;Data mining;Information model;Research progress;Research results
关联规则数据挖掘是在数据记录的数据项之间进行关联分析,两种常用方法是基于Apriori算法的挖掘方法和基于粗糙集理论的挖掘方法。基于Apriori算法的关联规则挖掘分为二阶段频繁项集的挖掘和关联规则的生成,挖掘频繁项集是核心。基于粗糙集理论的关联规则挖掘主要包括属性约简和规则提取。属性约简是关键。本项目用关联规则数据挖掘方法研究食物营养健康信息化模型改进基于矩阵的频繁集挖掘算法和基于辨识矩阵的属性约简算法;用改进算法建立基于关联规则数据挖掘的食物营养信息挖掘模型:首先用粗糙集的属性约简算法进行属性约简,然后用改进的Apriori算法进行关联规则挖掘;基于关联规则数据挖掘的挖掘模型进行食物消费关联规则数据挖掘。主要研究成果发表论文八篇,其中EI收录和核心论文六篇;开发两个软件,已由国家版权局颁发计算机软件著作权登记证书;申请两项专利,已获国家知识产权局专利授权。