东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

DNA序列的二阶隐马尔科夫模型分类

ISSN号：1003-3254
期刊名称：计算机系统应用
时间：2015.9
页码：22-28
分类：TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]福建师范大学数学与计算机科学学院,福州350007
相关基金：国家自然科学基金（61175123）
相关项目：面向软件行为鉴别的事件序列挖掘方法研究

作者：郭彦明|陈黎飞|郭躬德|

关键词：近邻分类, 变精度粗糙集, 代表点, 分类模型, 上, 下近似, nearest neighbor classification, variable precision rough set, representative, classification model, upper and lower approximation

中文摘要：

RSKNN 算法是一种基于变精度粗糙集理论的 k-近邻改进算法，该算法能够保证在一定分类精度的前提下，有效地降低分类的计算量，提高分类效率。但由于 RSKNN 算法只是简单地将每个类中的样本划分成一个核心和边界区域，并没有根据数据集本身的特点进行划分，因而存在极大的局限性。针对存在的问题，提出一种多代表点学习算法，运用结构风险最小化理论对影响分类模型期望风险的因素进行分析，并使用无监督的局部聚类算法学习优化代表点集合。在UCI公共数据集上的实验表明，该算法比RSKNN算法具有更高的分类精度。

英文摘要：

RSKNN is an improved kNN algorithm based on variable parameter rough set model. The algorithm guarantees under the premise of a certain classification accuracy, effectively reduces the computation burden of the classified samples, and improves the computation efficiency and precision of classification. But in this algorithm ,the instances of each class are simply classified into core and boundary areas. It has the limitation that it isn’t classified according the features of datasets. An efficient algorithm aiming at learning multi-representatives for RSKNN is proposed. Using the theory of structural risk minimization, a few factors that determine the expected risk of new classification model are analyzed. And an unsupervised algorithm for partial clustering is used to build an optimal set of representatives. Experimental results on UCI public datasets demonstrate that the proposed method significantly improves the accuracy of the classification.

同期刊论文项目

面向软件行为鉴别的事件序列挖掘方法研究

期刊论文 53 会议论文 11 获奖 2 著作 1

同项目期刊论文

识别聚类间远近关系的双几何体模型

检测迷惑恶意代码的层次化特征选择方法

使用多分类器组合的只能反钓鱼架构

A Novel Hierarchical Clustering Algorithm for Gene Sequences

Combined New Nonnegative Matrix Factorization Algorithms with Two-dimensional Nonnegative Matrix Fac

Soft subspace clustering of categorical data with probabilistic distance

Projected-prototype based classifier for text categorization

基于网格最小生成树的聚类算法选择

属性加权的类属型数据非模聚类

一种新型协作多机器人路径规划算法

一种基于改进Theta* 的机器人路径规划算法

基于RSKNN 分类改进算法

商务处理模型的配置

基于词性标注序列特征提取的微博情感分类

一种匹配全局结构的图相似性度量

EM-type method for measuring graph dissimilarity

自适应熵的投影聚类算法

基于隐马尔科夫模型的DNA序列分类方法

优化子空间的高维聚类算法

A Novel Variable-order Markov Model for Clustering Categorical Sequences

A probabilistic framework for optimizing projected clusters with categorical attributes

规范化相似度的符号序列层次聚类

Nearest neighbor classification of categorical data by attributes weighting

SMwKnn:基于类别子空间距离加权的互K近邻算法

Malicious sequential pattern mining for automatic malware detection

软件代码的恶意行为学习与分类

基于符号熵的序列相似性度量

Kernel-based linear classification on categorical data

一种基于混合模型的数据流概念漂移检测算法

Image Processing using Newton-based Algorithm of Nonnegative Matrix Factorization

一种事件序列的加权变阶马尔可夫模型

Modeling and Analyzing Mixed Communications in Service-oriented Trustworthy Software

恶意软件鉴别技术及其应用

Analyzing Event-based Scheduling in Concurrent Reactive Systems

基于符号化聚合近似的时间序列相似性复合度量方法

基于新 Haar-like 特征的 Adaboost 人脸检测算法

一种基于Pareto排序的混合多目标进化算法

基于滑动窗口和蚁群优化算法的二次路径规划算法

类属数据的贝叶斯聚类算法

多维数据的聚类结果可视化技术综述

融合速度特征的压缩感知目标跟踪算法

基于簇间分离性的稀有类识别算法

具有多形态种群协同进化的多目标优化算法

云计算中服务虚拟的形式依赖分析

融合张角拥挤控制策略的高维多目标优化

期刊信息

《计算机系统应用》
中国科技核心期刊

主管单位:中国科学院
主办单位:中国科学院软件研究所
主编：苏振泽
地址：北京8718信箱
邮编：100190
邮箱：csa@iscas.ac.cn
电话：010-62661041

国际标准刊号：ISSN：1003-3254
国内统一刊号：ISSN：11-2854/TP
邮发代号:82-558

获奖情况:

国内外数据库收录:
波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊（2000版）

被引量:15201