多标记学习起源于文档分类研究中遇到的歧义性问题,这里的一个示例可以有多个概念标记,其学习难度比传统的监督学习更大。这是国际机器学习界一个新的重要研究课题,不仅有助于理解人类在学习中对歧义性的处理机制,还会对自然语言处理等领域有所帮助。本项目将提出基于神经网络和k近邻的多标记学习算法,从而充分利用神经网络和k近邻的学习能力;提出结合了多标记学习和多示例学习的算法,从而比单纯的多标记学习或多示例学习具有更强的处理歧义性的能力;提出基于关系学习的多标记学习算法,从而充分利用关系学习的知识表示能力;设计出基于多标记学习的新型图像检索技术,从而比现有技术更好地处理图像的歧义性。上述研究内容在国际上尚未见到报道,其成果可望在国际上产生积极的影响。本项目不仅可望产生8-10篇高质量学术论文,还可望取得具有自主知识产权的专利技术。
多标记学习起源于文档分类中遇到的歧义性问题,是机器学习领域的一个重要研究课题。本项目对多标记学习进行了研究,完成了原定研究计划并取得了以下主要成果(1)提出了基于神经网络的多标记学习算法BPMLL;(2)提出了基于k近邻的多标记学习算法ML-kNN;(3)提出了多示例多标记学习框架和MIMLBoost、MIMLSVM算法;(4)提出了利用样本内蕴关系的多标记学习算法InsDif;(5)提出了图像主观相似度度量方法并将本课题产生的多种技术用于图像检索;(6)对多示例学习和关系学习等进行研究并取得进展。基于上述工作,本项目共发表论文14篇,其中国际刊物论文3篇(包括顶级国际刊物IEEE TKDE 1篇)、国际会议论文6篇(包括顶级国际会议AAAI'07、NIPS'06、IEEE ICDM'06各1篇),申请国家发明专利1项,获全国性学术会议论文奖1次。组织国际会议1次、国内会议3次,合作主持国际期刊专辑2期、国际会议文集2部。成果已被SCI、EI、ISTP检索22篇次,被国际同行他引10余次(包括在顶级国际刊物和会议例如IEEE TKDE、ECML'07等处的引用)。培养青年人才多名。