随着物联网与云计算时代的来临,数据的高维性和海量性已成为数据处理领域中的一种常态,数据的高维性和海量性带来的维灾难问题日益突出,导致众多成熟而有效的数据处理方法失效。为此,拓展降维思路,开展创新性的降维方法研究已成为数据处理领域研究的热点和重点。本项目拟在经济管理领域数据语义分析的基础上,提出降维过程中语义的本体表达与智能构建方法,将数据分析的任务语义与维度语义本体化,并建立以本体代数为核心的语义计算方法,借助该方法,将任务本体和维度本体进行语义相似度计算,以达到有效降维的目的。此外,本项目拟在经济管理领域有关行业中进行实证分析,检验所提理论和技术的可行性和有效性。项目研究将解决传统降维方法存在的两大问题一是,只注重数据数学特征,而忽略数据背后所隐含语义的问题;二是,降维方法与数据量和样本高度相关而易失效的问题。项目研究成果将为数据降维理论研究开辟新的途径。
High Dimension Data;Data Analysis;Data Dimension Reduction;Semantic Computation;Ontology Algebra
随着物联网、云计算、大数据等技术的飞速发展,数据得到了更加全面的获取和合理的利用,但随之而来的是数据的多样性、海量性、高维性等问题。因此,为了更好地使用数据,需要对数据进行预处理,而数据降维是数据预处理的重要内容。针对目前降维方法所普遍存在的语义缺失和高度依赖样本的问题,本项目首先在经济管理领域数据语义分析的基础上,研究了高维复杂数据分析的语义化问题,给出了语义的本体表达与自动化构建方法;其次,提出了完备的、准确的、系统的本体代数体系和基于本体代数的语义计算方法,并且建立了以本体代数为核心的语义高维数据降维理论,该理论克服了传统降维方法造成的语义无法保持以及与样本高度关联造成的易失效的问题;最后,在经济管理领域有关行业中进行了实证分析,检验了所提理论和技术的可行性和有效性。项目的研究成果充实了数据降维理论的研究内容,为大数据时代的数据有效分析开辟了新的途径。