本课题源自于课题组近年来对发酵过程中的计算机智能控制和建模的研究,其要解决的问题本质上是如下的计算机应用基础研究课题对于超大规模数据集驱动的模糊推理系统如何实现快速构建。课题组拟通过研究经典的TS型、广义型模糊推理系统构建与计算几何学中的最小包含球问题之间的关系,架构它们之间的桥梁。进一步利用计算几何学中针对大规模数据集的核心集,最小包含球快速学习理论探讨适宜于超大规模发酵数据集的各种模糊推理系统的快速构建算法。拟提出的算法特色是针对超大规模数据集,其时间复杂度的上界与数据集的尺寸呈线性关系;其空间复杂度与数据集的尺寸无关。同时,课题组还将根据发酵数据之特点,利用鲁棒的模糊间隔优化理论研究发酵数据的特征抽取预处理以及最优的模糊推理系统类型选择问题。该课题应用背景明确,所解决的问题对于计算智能、模式识别及其应用的研究具有一定的普遍价值,故具有重要的学术和应用意义。
Fuzzy systems;Large-scale data;Feature extraction;Clustering;Fermentation Modeling
在2010.01-2012.12执行国家自然科学基金(No. 60903100)过程中,按计划开展了相关的研究,重点是大规模数据驱动的模糊系统快速建模方法和理论及其在发酵过程控制等方面的应用。概括起来,本课题的成果和研究内容可归纳为如下的几个方面针对TSK模糊推理模型的特点,探讨了其面向大规模数据集时的快速构建问题;针对广义模糊推理模型的特点,探讨了其面向中大规模数据集时的快速构建问题;针对发酵等数据可能具有多源性等特点,探讨了具有知识迁移能力的ML型和TSK型迁移模糊系统建模方法,提高模糊系统在多源环境下的适应性和知识继承能力;针对发酵等高维数据进行有效特征抽取之应用目的,为了提高经典的Relief特征加权方法的适应性和鲁棒性,融合间距最大化和极大熵理论,探讨了新的鲁棒的具有更好适应性的Relief特征加权新算法;针对经典加权子空间聚类仅利用类内信息之不足,通过引入类间鉴别信息,提出了增强的加权子空间聚类算法来对高维数据进行聚类分析;针对建模数据的噪音问题带来的挑战,探讨了具有更好适应性的前馈网络建模方法,使得建模所得模型具有更好的鲁棒性和适应性。受该课题基金资助,课题组超额完成了原定任务,已发表11篇SCI检索(待检索)论文,30余篇EI检索(待检索)论文。