位置:成果数据库 > 期刊 > 期刊详情页
植物抗性基因识别中样本选择的一种新方法
  • ISSN号:2095-2163
  • 期刊名称:智能计算机与应用
  • 时间:2012.8.8
  • 页码:31-34
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001
  • 相关基金:国家自然科学基金(60932008,61172098); 高等学校博士学科点专项科研基金(20112302110040); 中央高校基本科研业务费专项资金(HIT.ICRST.2010022)
  • 相关项目:大豆RNA结构与进化分析的信息处理方法研究
中文摘要:

植物抗性基因识别中的从头预测方法可以看作机器学习中的分类问题。通常情况下,一个分类器的训练需要正确标记的正例和反例。然而,抗性基因识别中可用的信息仅有少数人工标记的抗性基因,且不具有抗性功能的基因也不明确。为了消除由于正例太少和错误的反例带来的抗性基因识别的影响,基于抗性基因和其他基因在蛋白质相互作用网中的距离,提出了一种新的样本选择方法,并对提出的样本选择方法和通常样本选择方法分别在四种分类器上进行了10倍交叉验证。结果表明,文中方法的SN值平均提高了6.9%,SP值平均提高了13.1%。因此,就敏感性和特异性而言,提出的方法获得了更高效、更可靠的结果。

英文摘要:

The recognition of plant resistance gene with ab initio method can be formalized as a classification problem. Usually, both la- beled positive and negative samples are required to train the classifier. However, the available information is only about less manually curated R-genes. To eliminate the low recognition rate of the classifier brought by the fewer positive sample and the false negative samples, a novel sample selection method is proposed according to the distance between genes and the curated R-genes in the protein-protein interac- tion network. Compared with the general sample selection method, experimental results are validated by the 10-cross validation on four dif- ferent classifiers. In the results, the SN and the SP of the proposed method separately increase 6.9% and 13.1% on average. Thus the method in the paper achieves higher and more reliable classification results than general method in terms of both sensitivity and specificity.

同期刊论文项目
期刊论文 69 会议论文 17 获奖 4 专利 3
同项目期刊论文
期刊信息
  • 《智能计算机与应用》
  • 主管单位:中华人民共和国工业和信息化部
  • 主办单位:哈尔滨工业大学 黑龙江省信息化办公室 黑龙江省计算机用户协会 黑龙江省计算机学会
  • 主编:徐晓飞
  • 地址:哈尔滨市南岗区繁荣街155号(哈工大新技术楼916室)
  • 邮编:150001
  • 邮箱:ica@hit.edu.cn
  • 电话:0451-86413183
  • 国际标准刊号:ISSN:2095-2163
  • 国内统一刊号:ISSN:23-1573/TN
  • 邮发代号:14-144
  • 获奖情况:
  • 1988,1991,1996,2000年黑龙江省优秀科技期刊
  • 国内外数据库收录:
  • 被引量:1007