特征信息发现即是在海量数据中发现具有某种所需特征的有效信息,通过这些特征信息,解释蕴含在海量数据中的客观规律,从而使得信息转化为可用的知识。本项目选择了计算化学与生物信息学两个学科领域,针对连续型数据(称之为A类)和离散型数据(称之为B类)两类特征信息发现问题,充分运用并行计算理论与技术,实现了基于均匀设计和Powell算法的并行全局最优化算法及结合分子力场的并行优化遗传算法,用于分子结构比较、建模与优化;研究序列motif算法,实现了经典软件MEME和Weeder的并行优化版本;基于新测序技术Solexa,提出一种短序列比对与组装算法SRMA,具有较高的性能和敏感度,已经取得较好的应用;研究、设计和实现了大规模Tiling Array探针重定位并行算法、LBC-TSI信号识别算法,能够识别低表达量探针,可过滤具有噪声嫌疑的高表达量探针。 取得的研究成果发表论文15篇,其中SCI 4篇,EI 7 篇;研发并行程序包 5 个,已经部署在国家网格主节点的超级计算机深腾7000上供用户使用;培养并毕业博士研究生2 名,培养并毕业硕士研究生4 名。
英文主题词features finding,parallel algorithm,bioinformatics,computational chemistry