随着时空数据的不断增长及广泛应用,高效可靠的知识发现方法无疑成为国内外计算机信息领域的研究热点,它在地理信息系统、遥感、交通信号控制等领域的应用有着重要实际意义。项目从时空数据挖掘的应用入手,针对现有时空数据挖掘的局限性,以网络环境下大规模时空数据集的高效知识发现核心算法作为研究主线,利用时空数据的特性,提出新的算法和理论框架,重点研究基于关键字的探索式时空数据挖掘、高效的时空同位模式挖掘和结合领域背景知识的时空数据聚类等技术与方法。通过开发近似查询执行算法来缩短探索式时空数据挖掘的时间,利用时间和空间特征的有机结合,深入研究时空数据集的简化方法和密度估算等问题,提高知识发现的效率和实用性。同时以时空数据的结构和语义描述为基础,建立时空同位模式兴趣度的度量框架,解决基于不同知识表示方式下的半监督时空数据聚类问题。研究成果将为高效分析大规模时空数据并从中发现有价值的知识提供新思路和理论依据。
spatial-temporal datamining;keyword searching;spatial-temporal collaboration;domain knowledge;interest degree
随着时空数据的不断增长及广泛应用,高效可靠的知识发现方法无疑成为国内外计算机信息领域的研究热点,它在地理信息系统、遥感、交通信号控制等领域的应用有着重要实际意义。本项目从时空数据挖掘的应用入手,针对现有时空数据挖掘的局限性,以网络环境下大规模时空数据集的高效知识发现核心算法作为研究主线,利用时空数据的特性,提出新的算法和理论框架,重点研究基于关键字的探索式时空数据挖掘、高效的时空同位模式挖掘和结合领域背景知识的时空数据聚类等技术与方法。为高效分析大规模时空数据并从中发现有价值的知识提供新的思路和理论依据。 本项目从时空数据挖掘的应用出发,选取三种具有典型时空特征的应用案例,并进行相关数据收集和处理,构建统一的时空数据挖掘平台原型。在确保时空数据挖掘平台完整、规范的基础上,重点开展以下几个方面研究 1)引入谱聚类方法,利用特征矩阵描述时空数据变化趋势的差异性,通过时空数据约简算法及近似查询分析研究基于关键字的探索式时空数据挖掘的方法和技术,提高了时空数据查询的高效性和准确性。利用实验数据实现时空数据查询的预计算,过滤时空数据检索中的非相关特征,效果良好。 2)在时空同位模式的探索方面,针对专题时空数据集稀疏程度过大的问题,采用改进的类Apriori算法对时空数据集进行处理。通过增加数据的空间位置信息,采用滑动立方体替代传统的滑动窗口,以挖掘空间中频繁出现的事件或特征值。结果表明空间位置信息的加入对提高聚类精度有很大帮助。 3)引入尺度空间概念,以时空数据的结构和语义描述为基础,定义兴趣度框架,提出一种基于时空同位模式下的数据挖掘改进算法;结合地理信息学进展,利用领域背景知识的影响,提出结合LUCC领域背景的时空数据聚类算法,引导和改进聚类过程,解决基于不同知识表示方式下的半监督时空数据聚类问题。 4)针对结合领域背景知识的时空数据聚类方法研究,项目利用GIS空间分析技术,引入Moran'I空间相关性分析模型,分析聚类结果在空间维度上的相关性,结果表明聚类结果同空间分布上存在明显的相关性。此外,还提出了一种简单快速算法在稀疏及噪声的数据集中高效寻找多个全局线性相关目标。