近年来,随着网络技术的迅猛发展,以应用之间在网络上进行海量的数据交换为特点的新型数据密集型应用大量涌现。在提高数据处理效率的同时。也带来了大量的不确定数据。现有的不确定数据管理技术主要集中于概率关系数据管理技术方面,而面向不确定数据流的复杂数据管理技术则仍然远未成熟。本项目将重点围绕新型应用中出现的数据流对象簇不确定性问题开展对象簇管理理论与关键技术的研究工作,力争在不确定对象模型、对象聚簇、查询处理等理论、技术与方法方面取得原创性的突破成果,并且通过构建 2 个原型系统来验证这些研究成果的有效性,预期在国内外重要学术期刊和学术会议上发表高水平学术论文 10 篇左右。相关研究成果将为新兴应用的对象簇管理提供新的解决方案,具有重要的理论意义与实践价值。
uncertain;data stream;query;cluster;object cluster
随着网络技术和移动技术的迅猛发展,以应用之间在网络上进行海量的数据交换为特点的新型数据密集型应用大量涌现。在提高数据处理效率的同时。也带来了大量的不确定数据。本课题重点围绕新型应用中出现的数据流对象簇不确定性问题开展对象簇管理理论与关键技术的研究工作,在不确定对象模型、对象聚簇、查询处理等理论、技术与方法方面取得一些原创性的研究成果,实现了一个基于Hadoop云平台技术的不确定数据流原型系统,应用于Pinggo实时拼车系统之中。同时,将不确定数据流的一些关键算法及存储技术应用于物联网技术平台,如嘉定马陆葡萄园物联网实验平台,为今后的不确定数据流上对象簇的深层次研究打下了坚实的基础。研究结果发表在计算机领域国内学报、ICISE国际会议等期刊和论文集,其中EI检索3篇,国内核心刊物七篇,国际会议三篇。发明专利一项,实用新型专利一项。培养硕士研究生 3 名、博士研究生 1 名。同时,研究结果也体现了较好的应用价值,实时拼车Pinggo系统获得到全国软件专业人才创新大赛一等奖,获得上海理工大学研究生核心课程建设项目《并行计算》。