由于降水观测站网的设置受地形、交通、通信等条件限制,密度不够,加之数据提交滞后,遇到暴雨时线路常遭破坏,因此利用卫星云图进行暴雨监视和预报是一种重要手段。本项目针对防汛指挥中防汛和水文专家利用卫星云图人工经验性判断降水方法中的不足和定量分析降水的需求,研究和探讨利用图像数据挖掘技术,从大量的卫星云图数据和雨量数据中发现和挖掘出隐含的云图与降水关系的模式的理论和方法,获取云图与降水之间的定量和定性的关系和知识。主要研究内容包括云顶温度与降水的关联模式分析与挖掘,获取云图与降水量等级的定量模式;基于降水度量的卫星云图分类,把典型的降水和非降水云系分类出来,同时结合降水的度量等级,支持根据云的种类预测降水;基于时基卫星云图的降水预测,得到任意一点(区域)的雨量估计,包括没有设置雨量站的地方,增长洪水预见期。本项目探讨卫星云图与降水数据融合挖掘的新理论和方法,在防汛指挥调度中具有重要的实用价值。
项目研究基于图像挖掘技术的卫星云图和降雨关系的理论和方法。云图属于非结构化图像数据,地面雨量记录属于结构化数据,项目引入多维数据立方体的概念,将云图的图像特征,雨量数据等信息作为立方体的维度,有效地实现了两类数据的结合。项目引入"事务模式"概念,针对云图数据量大特点,提出了基于事务模式的Apriori算法,获得了有价值的挖掘结果,同时满足了效率需求。云图分类研究大多集中于利用单一特征集结合分类器进行云图分类,忽略了各特征相结合所具有的分类潜能,本项目根据信息融合思想提出了一种卫星云图多特征融合分类方法,使得分类器对云图的分类准确性得到明显的提升。项目针对云图分类挖掘的不确定性,在传统的FCM聚类方法中加入先验信息,将原来的非监督的聚类变成半监督聚类方法,通过与已标签的样本进行相似性比较,有效提高针对云图数据的聚类算法的准确度。项目提出的方法和获得的结果有效的提高了短期降雨预报的准确率,有利于防汛决策的制定;有效地提高了云图自动识别分类的能力,显著减轻了人工判读云图的工作量。