基于内容多样性学习的植物图像检索技术是植物数字化研究和数字农业领域中一个新兴的重要研究方向。本项目将根据植物图像特点与用户潜在需求,着重从特征提取层与分类器层展开研究。首先,基于植物图像分割目标形状、纹理与颜色的近似对称性先验信息,构建一种对称度量驱动型水平集分割方案以提高分割效率;然后,分析LLE算法局部重构权与噪声数据的关系,设计快速高效的流形噪声数据检测方法;接下来,充分利用多子流形学习算法能够最大化子流形间差异的优势,在各子类局部约束基础上,针对正类设置局域结构增强与分布差异扩大双约束来进行半监督特征提取;并设计新型的最大散度多样性静态评价函数来指导流形算法参数选择;进一步尝试采用植物多样性类比表征指标设计评价标准;最后,针对样本非均衡分布问题,研究径向基概率神经网络结构优化方法以提高检索多样性。本项目的开展将有利于图像处理与检索技术的发展,同时也能够促进信息技术在农业领域的应用。
plant image;image segmentation;manifold learning;image set classification;diversity retrieval technique
本项目基本按照研究计划顺利进行,提出了面向植物图像识别与检索的内容多样化学习技术。工作主要包括以下四个方面植物图像数据库建设;植物图像分割方法;植物图像检索方法;植物图像集合分类方法。本项目在水平集分割模型的基础上,引入图像中的形状和颜色信息作为先验信息来指导分割曲线的演化,针对图像边界模糊、有遮挡、与背景灰度相似的目标等复杂背景的图像,实现了快速、准确的目标分割。进一步从植物图像目标的近似对称性这一先验信息出发,重点设计目标自身对称性检测指标,并将其作为约束项融合到能量函数中,从而构建了一种新颖的、有效的对称度量驱动的水平集图像分割方法。本项目提出了由彩色植物叶片图像到手绘扫描的二值叶片图像的检索设想,依据植物叶片图像和手绘扫描叶片图像的不同性质,深入讨论了两类图像形状和纹理特征的提取方法,通过实验比较,选择切实可行的特征描述符实现了检索系统的原型。本文提出的检索方案为植物分类检索研究提供了有力尝试,该方案对推进植物图像检索的实用化有一定意义。本项目对植物图像特征提取,聚类多样性检索、面向分类的多子流形学习等内容进行了较为全面的研究。首先提出了基于最大散度评估的植物图像聚类多样化检索技术,该方法使用重排技术和SVM相关反馈的检索机制,再使用AP聚类算法,使检索结果同时具有相关性和多样性的特点。接下来重点研究了基于多子流形学习特征提取的多样性检索技术,该方法使得投影到低维空间后,每个子流形间的距离尽量增大,避免一个子流形中的图像都被检索,从而达到多样性检索的目的。这样不仅提高检索结果的多样性,也提高了检索的相似性,此外该算法不需要相关反馈机制便可以达到较好的检索效果,提高了检索效率。由于每类图像集包含了该类植物的多种变化模式,因此能够更有效的表示一类植物个体。与传统的基于单样本的植物图像识别算法相比,基于植物图像集的识别算法具有更好的鲁棒性与性能。本项目把植物图像集建模成非线性的流形,并在流形间距离的计算框架下,提出一种基于流形间距离的植物图像集分类算法。然后本项目又提出了一种基于自适应多凸包的图像集分类算法。解决了单凸包对于非凸数据的不合理建模,以及分类时只使用了少量的边界信息,容易受到噪声图像干扰等缺点。