位置:成果数据库 > 期刊 > 期刊详情页
基于多核学习的双稀疏关系学习算法
  • ISSN号:1000-1239
  • 期刊名称:《计算机研究与发展》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]中国科学院自动化研究所复杂系统与智能科学重点实验室,北京100190
  • 相关基金:国家“九七三”重点基础研究发展计划基金项目(2004CB318103); 国家自然科学基金项目(60573078)
中文摘要:

在关系学习中样本无法在Rn空间中表示.与其他机器学习问题有很大不同,因为无法利用Rn空间的几何结构使得其解决异常困难.将多核学习方法用于关系学习中.首先,可以证明当用逻辑规则生成的核矩阵进行多核学习时,其他核都可以等价转化为线性核.在此基础上,通过用修正FOIL算法迭代生成规则,构造相应的线性核然后进行多核优化,由此实现了由规则诱导出的特征空间上的线性分类器.算法具有"双稀疏"特性,即:可以同时得到支持向量和支持规则.此外,可以证明在规则诱导出的特征空间上的多核学习可以转化为平方l1SVM,这是首次提出的新型SVM算法.在6个生物化学和化学信息数据集上与其他算法进行了对比实验.结果表明不仅预测准确率有明显提高,而且得到的规则集数目更小,解释更为直接.

英文摘要:

Relational learning is becoming a focus in machine learning research.In relational learning,samples cannot be represented as vectors in Rn.This characteristic distinguishes it from other machinelearning tasks in that relational learning cannot utilize the geometric structure in Rn and thus is much harder to solve.In this paper a multiple kernel learning approach for relational learning is proposed.First of all,it is proved that for multiple kernel learning with the kernels induced by logical rules,it suffices to use the linear kernel.Based on this,through iteratively constructing rules by a modified FOIL algorithm and performing the corresponding multiple kernel optimization,the proposed approach realizes an additive model on the feature space induced by the obtained rules.The algorithm is characterized by its "bi-sparsity",i.e.,support rules and support vectors are obtained simultaneously.Moreover,it is proved that the multiple kernel learning in the feature space induced by rules is equivalent to squared l1 SVM.The proposed algorithm is evaluated on six real world datasets from bioinformatics and chemoinformatics.Experimental results demonstrate that the approach has better prediction accuracy than previous approaches.Meanwhile,the output classifier has a straightforward interpretation and relies on a smaller number of rules.

同期刊论文项目
期刊论文 17 会议论文 6
同项目期刊论文
期刊信息
  • 《计算机研究与发展》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院计算技术研究所
  • 主编:徐志伟
  • 地址:北京市科学院南路6号中科院计算所
  • 邮编:100190
  • 邮箱:crad@ict.ac.cn
  • 电话:010-62620696 62600350
  • 国际标准刊号:ISSN:1000-1239
  • 国内统一刊号:ISSN:11-1777/TP
  • 邮发代号:2-654
  • 获奖情况:
  • 2001-2007百种中国杰出学术期刊,2008中国精品科...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:40349