本项目针对医学图像的特点,结合医学领域知识,集中研究了医学图像挖掘问题,提出了一系列医学图像关联规则、分类、相似性搜索和聚类等挖掘算法。本项目的创新之处主要表现在如下方面 第一,本项目在频繁项集的生成算法中,根据领域知识给出了一个约束函数,大大减少了频繁项集的生成。在规则生成算法中,给出约束函数,对出现在规则前后项的对象进行限制,降低了规则的数量,同时提高了规则的质量。第二,本项目针对医学图像分类中不同类型的错误分类造成的分类误差代价存在着严重不平衡性,提出了基于AdaBoost算法的代价敏感的集成分类算法和基于随机森林的分类算法,增加了分类的准确率和可靠性。第三,本项目针对医学图像的序列形式,提出了图像序列相似模式的概念,设计了基于领域知识的算法来发现每个病患的图像序列模式ISP和病患之间的ISSP,以支持医学图像序列相似性搜索,提高了检索的准确率。第四,本项目以具有诊断意义的关键像素区域(ROI)为核心,提出了基于ROI的两级聚类策略对医学图像进行聚类,获得很好的聚类效果。
英文主题词medical image;association rule;classification;clustering;similarity retrieval