多变量IB方法在处理多元化、数量巨大、多样性特征的信息方面有着独特的优势,本项目针对多变量IB方法研究中所存在的关键问题相关维数的确定、协作模型的建立、平衡参数的确定、多变量IB方法的应用适宜性等问题;基于不同的多变量IB模型,拟采用最小描述长度准则(MDL)及近邻传播方法来自动确定相关系统的维数;以多变量互信息作为压缩变量之间约束程度的度量,解决变量之间相互协作的问题;用基于滑动窗的层次聚集树作为描述序列数据的基本结构,解决上下文相关IB序列特征空间边界确定的问题;基于ANN,采用自适应调整技术,求解平衡参数β;项目拟采用不同的多变量IB模型,进行隐藏信息分析、早期食管癌内镜图像识别的研究,力图发现多变量IB方法所适应的问题特征及规律。该项目的研究一方面丰富了多变量IB方法及算法,另一方面对多变量IB算法应用于信息安全、海量数据集分析、图像模式分析、医疗诊断提供了坚实的基础。
Multivariate IB;Information compression;Mutual information;Entropy;Machine learning
项目针对多变量IB方法及算法研究中所存在的多种相关变量的协调问题,从数据双向压缩、无冗余多视角聚类、多特征变量信息融合和选择性数据分析四个问题切入,提出了交叉对称IB协作模型、无冗余IB协作模型、多特征IB协作模型与基于数据局部一致性特征的IB协作模型,并研究了相关的优化算法。针对多变量IB方法相关参数平衡调整和确定等问题,在IB方法上引入属性权重计算方法及赋权机制,从而提高IB方法的数据分析性能。针对多变量IB方法的应用适宜性的问题,进行了多变量IB方法、互信息在视频数据、图像数据、医学信息、群体行为模式识别等方面的应用研究,提出了有效的模型和相关算法,对多变量IB方法应用适应问题的特征有了深入的认识。为了更有效的研究多变量IB算法的效率,对其他相关方法和分析工具也进行了一些相关性研究,提出了一种增量式学习方法、一种基于近邻准则的组合选择方法等等;进行了多种时间序列数据处理方法的研究,改进相关的模型,丰富了多变量IB方法研究的实验平台。项目所取得的一些有意义的成果,发表在国际、国内重要的学术会议/期刊如ACM Multimedia 2012、CIKM 2012、IJCAI 2013、ACM Multimedia 2015、 Knowledge-Based Systems、Decision Support Systems、 Computer Graphics Forum、Pattern Recognition Letters 、Intelligent Data Analysis、计算机学报、计算机研究与发展、电子学报等。