本项目利用贝叶斯网络匹配错综复杂的数据关系并融入核方法的思想,构建基于图形模型的智能数据分析和推理预测机制,为动态变化、大容量和复杂性的数据处理提供理论基础和应用范例。根据变量的独立关系和网络结构描述不同成分数据的内在概率关系,建立对应的概念类,并应用核方法的思想将概念类嵌入到内积空间,构建基于贝叶斯网络的智能数据分析原理。研究图形模型诱导的VC维和内积空间维数求解的方法,探讨图形模型诱导的数据分类能力和实施分类所需资源的关系,揭示智能数据分析中VC维的变化规律, 求解多值、连续贝叶斯网络诱导的内积空间最低维数。通过图形模型的分解和采用自适应条件措施,设计兼顾时间约束、空间约束以及推理质量的推理算法,建立具有良好扩展性和自主调节性的智能数据推理预测理论。通过本项目的开展,夯实基于图形模型的智能数据分析和推理的理论基础,为各类数据分析预测的实时性、智能性和复杂性提供强有力的技术支持。
Bayesian networks;Data analysis;Inner product space;VC-dimension;Latent network structure learn
贝叶斯网络是概率统计与图论相结合的图形模型,是多维变量联合分布的图形表示,在不确定性知识的表达和推理方面具有独特优势,已成功地应用于机器学习、生物信息学、金融分析等多个领域.本项目利用贝叶斯网络匹配错综复杂的数据关系,研究基于图形模型的智能数据分析和推理预测机制,为数据分类和预测提供理论基础和应用范例. 根据变量的独立关系和网络结构,建立对应的概念类,并应用核方法的思想将概念类嵌入到欧几里得内积空间.研究求解图形模型诱导的VC维和相应的最低内积空间维数的方法,探讨图形模型的数据分类能力和实施分类所需资源的关系,揭示智能数据分析中VC维的变化规律.我们获得多值全连接贝叶斯网络所对应的VC维和内积空间维数;以及没有V结构多值贝叶斯网络的这两个维数值.当布尔域的贝叶斯网络节点小于5时,所有的网络结构对应的这两个维数相等.本项目还研究了多维数据分类问题,得到了分类效果较好的多维贝叶斯分类模型. 本项目研究了基于最大主子图分解的贝叶斯网络等价类学习算法.利用无向图分解理论给出了基于全条件独立的最大主子图分解方法;利用该方法可以对目标网络的无向独立图进行分解,使得复杂高维系统的数据模式分解成若干子模块,从而将结构学习简化为局部子网络的学习;已经证明这种分解不会破坏随机变量的局部统计信息.在忠实性分布的假设条件下,提出了利用确定变量的Markov边界的算法,提高了条件独立测试的效率.对于贝叶斯网络结构学习,我们提出了一种基于信息论与假设检验相结合的依赖分析方法. 本项目基于因果推断给出了学习隐网络结构的方法.利用观察数据学习隐网络的映射图,在考虑计算总体花费的情况下,结合先验知识提出了确定未定向边方向的算法,得到最佳的隐网络的代表图.理论上对此算法进行了证明,实验结果说明此算法不仅可以减少噪音、确保条件独立测试的可靠性,而且减少了测试次数,降低了学习结构的复杂度. 本项目还研究了跳频序列预测,提出了一种基于图形模型的跳频序列预测系统.根据电台跳频序列的特点,给出了相关的数据预处理算法,对同步跳数据进行了仿真分析,并给出预测系统相关的原理和具体的实施步骤.利用构建预测的系统对真实的跳频数据进行了仿真实验,仿真结果表明同步跳数据可以被准确预测,模型的单值预测呈波动现象,平均预测率较高.