东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于相似性混合模型的蛋白质交互识别

ISSN号：1000-3428
期刊名称：计算机工程
时间：2014.10
页码：25-30+35
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]南京航空航天大学计算机科学与技术学院,南京210016
相关基金：国家自然科学基金资助项目（61202132,61170043）.
相关项目：基于文本中关系相似性的蛋白质交互作用自动识别研究

关键词：蛋白质交互, 关系相似性, 单词相似性, K近邻分类, 层次聚类, Protein-protein Interaction（PPI） , Relational Similarity （RS） , word similarity, K-nearest Neighbor（KNN） classification , hierarchical clustering

中文摘要：

现有采用机器学习方法的蛋白质交互关系识别系统仅以单句为依据，并且存在标注数据缺乏导致训练集规模小的问题。为此，基于相似性混合模型提出一种新的蛋白质交互识别方法。采用基本的关系相似性（RS）模型做初始判断，利用大规模文本计算单词特征间的相似性，在基本RS模型的基础上通过特征聚类方式引入单词相似性模型，从而建立一个混合模型。实验结果表明，该方法能够取得较高且较均衡的精确度和召回率，而单词相似性的引入又进一步提高了F值，并且其直接利用已有的交互信息，可避免额外的人工标注。

英文摘要：

Current machine learning-based Protein-protein Interaction （PPI）identification systems make predictions solely on evidence within a single sentence and suffer from small training set. In this paper, a hybrid similarity model- based approach is proposed to address these issues. A basic Relational Similarity （RS） model is established to make initial predictions. Word similarity matrices are constructed using a corpus-based approach. A clustering algorithm is applied to group words according to their similarity. The obtained word clusters are introduced to the basic RS model to build a hybrid model. Experimental results show that the basic RS model achieves higher and well-balanced precision and recall, and the introduction of the word similarity model further improves the F-score. This approach makes use of known PPI information, thus releases the burden of manual annotation.

同期刊论文项目

基于文本中关系相似性的蛋白质交互作用自动识别研究

期刊论文 25 会议论文 1

基于抽象的软件符号模型检测研究

期刊论文 20

同项目期刊论文

基于双格的多值模型的精化关系与对称化简

基于情绪强度的中文微博情绪分析

多层次中文微博情绪分析

基于词性加权和单词相似性的蛋白质交互识别

基于特征加权的蛋白质交互识别

一种状态事件故障树的定量分析方法

ESpin:基于SPIN的Eclipse模型检测环境

面向适航认证的模型驱动机载软件构件的安全性验证

支持模型检测的故障树生成方法研究

缓存区溢出研究与发展

一种基于状态事件故障树的软件安全性分析方法研究

将故障信息扩展到功能模型的安全性分析方法研究

基于扩展SysML活动图的嵌入式系统设计安全性验证方法研究

云计算环境中支持语义的安全策略匹配研究

基于图谱理论几何空间结构变换的大数据核聚类算法

本体评估方法研究综述

概率模型检测的网络传播干预策略

一种状态事件故障树的时间特性分析方法

Adaptor Reconfiguration Analysis in Web Services Composition

一种基于情绪激励度的情绪词加权算法

基于关系相似性的蛋白质交互自动识别

基于词典的中文微博情绪识别

模型检测网络传播干预策略

基于朴素贝叶斯模型的多层次中文微博情绪分析

基于情绪特征的中文微博用户性别识别

基于统计数据的微博表情符分析及其在情绪识别中的应用

基于多层次语言特征的弱监督评论倾向性分析

基于情绪强度的中文微博情绪分析

多层次中文微博情绪分析

基于关系相似性的蛋白质交互作用识别

基于词性加权和单词相似性的蛋白质交互识别

基于多线索混合词典的微博情绪识别

基于特征加权的蛋白质交互识别

Protein-protein interaction identification using a hybrid model

基于Minimum Cuts的蛋白质交互识别

期刊信息

《计算机工程》
北大核心期刊（2014版）

主管单位:中国电子科技集团公司
主办单位:华东计算技术研究所上海市计算机学会
主编：游小明
地址：上海市桂林路418号
邮编：200233
邮箱：ecice06@ecict.com.cn
电话：021-64846769

国际标准刊号：ISSN：1000-3428
国内统一刊号：ISSN：31-1289/TP
邮发代号:4-310

获奖情况:
1999～2000、2001～2002年度信息产业部优秀期刊奖,2003-2004、2005-2006年度信息产业部电子精品科技...,2007-2008、2009-2010年度工业和信息产业部电子精...,012年度中国科技论文在线优秀期刊一等奖,2013年度中国科技论文在线优秀期刊二等奖

国内外数据库收录:
俄罗斯文摘杂志,美国化学文摘（网络版）,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:84139