社会经济活动形态的日趋复杂和规模的不断增长导致其产生的数据迅速膨胀,主要特征表现为规模的海量性、表示的高维性、结构的复杂性、时空动态性,同时具有不完整、不确定、非协调等特点,对高维复杂数据的分析利用成为经济管理领域信息处理面临的主要任务。本项目针对符号数据、函数数据、成分数据等经济管理领域中典型的高维复杂数据,就与之相关的两大核心科学和技术问题高维复杂数据的数学建模与知识推理、高维复杂数据的综合利用与行为决策,开展深入系统的研究。具体内容(1)符号数据的粒化、粒度空间结构、基于多粒度与动态粒度的问题求解模型与算法;(2)函数数据的聚类、基于粒度支持向量机的分类与回归分析;(3)成分数据的方差分析方法、时序成分数据的预测方法;(4)区域全社会固定资产投资决策、股票投资选择决策等问题的实证研究。项目研究成果将形成一个高层次复杂数据分析的基础理论体系,创新经济管理领域数据分析的理论与应用。
High-dimensional complex data;Investment decision;Granular computing;Feature reduction;Clustering
随着社会经济活动形态的日趋复杂和规模的不断增长,投资决策等经济管理领域的各类数据呈现出规模的海量性、表示的高维性、结构的复杂性、时空动态性等特点。项目组面向投资决策等国民经济与社会发展中的现实决策分析问题,以粒度计算为主要理论分析框架,以信息熵为不确定性度量的主要工具,围绕高维复杂数据的建模与高效算法,开展了特征降维、聚类分析、分类与回归、决策建模与实证分析等方面的系统研究。主要理论创新成果概括如下(1)为应对数据的大规模性、快速增长性等挑战,项目组采用“样本表征整体”、“特征重要度的递推计算”以及“双维度加速机制”等策略,提出了一系列高效特征降维方法与算法,为高维复杂大数据环境下决策建模过程中关键指标选取提供了高效求解方法。(2)针对数据特征的混合性、数据分布的非平衡性、数据规模的海量性、数据增长的实时快速性等特点,基于“加权相似性度量”、“类的多中心代表元”、“有效性评价指标”、“目标函数设计策略”等技巧与策略,项目组发展了一系列聚类分析方法与高效算法,为探测高维复杂数据中的类结构提供了有效方法。(3)采用“主动学习”、“粒度计算”、“核方法”、“组合与融合”等策略,项目组提出了一系列针对二维表数据、函数数据、成分数据的分类与回归新方法,为不同数据形式下的预测与决策提供了有效方法。(4)在决策建模方面,项目组提出了基于粗糙集理论的分层多属性群决策模型,以及基于“一致度、贴近度与均衡度”的群决策效果评价准则;提出了基于优势粗糙集模型的稳健型证券投资的两级排序全序化方法。结合理论研究成果,项目组选择了股票价值投资决策、企业财务危机预警、CPI周期性波动趋势预测、人口结构组合预测等典型应用问题,开展了实证研究。特别是项目组关于股票价值投资决策的研究成果被应用于大同证券有限责任公司的证券资产配置、证券投资策略设计以及大客户咨询等业务,取得了显著效果。项目组研制的高维复杂数据挖掘实验系统可为高维复杂数据分析提供可靠的计算平台。总体上,研究成果既为高维复杂数据的建模与分析提供了一般性基础理论和高效算法,同时又为某些基于大数据的投资决策典型问题提供了问题求解方法与决策建模技术。