将数据挖掘理论与方法引入到干旱区径流过程的研究,应用以计算机技术为基础的现代信息技术,充分考虑径流数据本身的水文物理特性,研究干旱区水文数据挖掘的理论、技术和方法,从日径流的历史观测数据集中挖掘有用的规律和知识,为解决干旱缺资料地区的水文水资源研究提供新的思路和方法。本研究1)从理论上构建干旱区水文数据挖掘算法框架,以径流过程为研究对象,对多种数据挖掘算法进行改进,通过径流过程的水文阶段划分、相似性搜索、模式发现、关联规则挖掘,深入挖掘长历时的径流序列中所蕴藏的径流模式;2)构建对气候条件响应的干旱区水文模型,利用模型参数定量分析气温和降水对不同径流模式的贡献率,分析径流模式对不同气候条件的响应;3)将干旱区径流过程的数据挖掘算法流程应用于我国塔里木河流域,对流域主要出山口水文站近50年的日径流序列进行信息挖掘,得出流域径流模式的种类,并进行关联规则的水文预报。
data mining;hydrological processes;the Tarim River;runoff pattern;hydrology model
数据挖掘技术的发展为水文水资源和水信息学的研究提供了新的方法。本研究将当前在金融以及生物医学领域应用广泛的时间序列数据挖掘的理论和方法引入到水文循环过程的研究中,选取干旱区的典型流域——塔里木河流域为研究区,分析了流域近50年日径流序列的水文过程变化特征。主要内容和结论如下(1)将时间序列数据挖掘的理论、方法和技术与水文过程研究相结合,系统地提出水文时间序列数据挖掘的基本框架和算法流程,完成一整套水文时间序列数据挖掘的步骤,包括水文阶段有效划分、相似性搜索、聚类模式发现等,并选取干旱内陆区的典型流域——塔里木河流域作为研究对象,研究适合干旱区水文数据挖掘的方法,充分挖掘资料缺乏地区的水文过程所蕴含的信息。(2)提出两种水文时间序列划分的方法基于季节过程的水文阶段划分法和基于洪水过程的水文阶段划分法。基于季节过程的水文阶段划分方法,克服了传统方法以春夏秋冬四个季节为单位的“一刀切”划分缺陷,它是以月为单位进行水文阶段划分,相同的月份合并为同一水文阶段,不同的月份被作为一个独立的水文阶段,划分得到的水文阶段体现了径流过程的季节特性。基于洪水过程的水文阶段划分,则是结合了分段合计近似算法和重要点算法,通过程序化快速完成自动划分长时间的水文径流序列洪水过程。(3)提出了基于动态时间扭曲距离度量的水文时间序列相似性搜索算法。季节性的水文过程往往表现出一定的相似性,但往往时间轴上并不对齐,动态时间扭曲法很好地解决了两个相似的序列在时间轴上不一致的问题,适合于水文时间序列数据的相似性距离度量。水文径流序列相似性搜索算法属于程序化的机器识别,只要设定合适的相似距离阈值,算法就能自动、有效、快速地识别出相似径流过程。(4)充分考虑气温和降雨因素对径流的影响,提出了气温降雨修正的AR(p)模型。不仅解决了不同类型补给河流径流以及同一河流不同径流模式的模拟问题,而且定量分析了流域径流补给成分受气候影响的年内变化和年际变化。通过在塔里木河流域的应用,证明模型对以融雪和降雨补给为主的河流具有更精确模拟的优势,非常适用于中纬度高海拔的干旱区流域。