本项目,首先研究了限制性贝叶斯网络依赖关系,利用条件对数似然函数导数的性质,删除冗余依赖的关系;并提出了一种以各个结点为中心的打分搜索算法,设计了针对多类的置信度度量函数,提出了一种增强型降噪参数集成算法,抑止了噪声,避免了过度拟合.其次,在分析目前分类过程中对不完整数据的处理方法的基础上,提出了一些基于分布的不完整数据分类算法。第三,利用马尔科夫等价类的概念,分析出树型限制性贝叶斯网络分类器结构学习算法可以忽略网络弧重定向过程,深入研究了求解图的接近最大生成森林理论与算法之中所涉及到图的同构算法和特定子图查找算法。第四,基于打包法(wrappers)给出了两个有效的选择性不完整数据分类器。第五,提出了基于Volume Test的树形贝叶斯分类算法和基于评价与基于条件依赖相结合的贝叶斯分类算法,其结合了两种学习策略的优点,提高了贝叶斯网络的灵活性。第六,提出了几种基于显现模式的贝叶斯分类算法,包括一种懒惰式学习方法。最后,还研究了限制性贝叶斯网络中元学习策略的应用,提出了两种新的树形朴素贝叶斯分类器,并使用元学习策略提升其性能。所有算法都进行了相应测试。
英文主题词Machine Learning; Data Mining; Classifier; Beyesian Network