位置:成果数据库 > 期刊 > 期刊详情页
基于特征加权的蛋白质交互识别
  • ISSN号:1673-629X
  • 期刊名称:计算机技术与发展
  • 时间:0
  • 页码:-
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:南京航空航天大学计算机科学与技术学院,江苏南京210016
  • 相关基金:国家自然科学基金资助项目(61202132,61170043)
  • 相关项目:基于文本中关系相似性的蛋白质交互作用自动识别研究
作者: 吴红梅|牛耘|
中文摘要:

在以单词为特征的模型中,如果特征单词在不同类别中的使用情况存在明显差异,那么它对分类有着很重要的影响。因此文中基于大规模语料库,研究不同的特征加权方法对PPI识别的影响。首先,通过搜索医学文献数据库建立蛋白质对的签名档,以单词作为描述蛋白质对关系的特征,构建向量空间模型;然后,选择不同的加权方法描述单词重要性;最后,以K近邻和SVM分类方法构建分类器判断蛋白质对是否存在交互关系。实验结果表明,根据特征向量单词的重要性进行加权,PPI识别精确度、召回率和准确率有了明显的提高。

英文摘要:

In a model characterized by word,if the use of feature word in different categories exists obvious differences,it will have a very important impact on classification. Based on a large- scale corpus,study the effects of different methods of feature weighting on protein- protein interaction identification. Firstly,the signature of a protein pair is obtained by searching large scale biomedical text. Taking the words as the features which describe the relationship between the protein pair,construct Vector Space Model( SVM). Then,select different weighting methods to describe the importance of words. Finally,K nearest neighbor and SVMclassifier are applied to identify PPIs.According to the experimental results,PPI recognition accuracy and recall and precision have been significantly improved when the feature vectors are weighted.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机技术与发展》
  • 中国科技核心期刊
  • 主管单位:陕西省工业和信息化厅
  • 主办单位:陕西省计算机学会
  • 主编:王守智
  • 地址:西安市雁塔路南段99号
  • 邮编:710054
  • 邮箱:ctad@vip.163.com
  • 电话:029-85522163
  • 国际标准刊号:ISSN:1673-629X
  • 国内统一刊号:ISSN:61-1450/TP
  • 邮发代号:52-127
  • 获奖情况:
  • 《CAJ-CD规范》执行优秀期刊
  • 国内外数据库收录:
  • 中国中国科技核心期刊
  • 被引量:21263