高维数据特征选择的稳定性研究-东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：立项数据库 > 立项详情页

高维数据特征选择的稳定性研究

项目名称：高维数据特征选择的稳定性研究
项目类别：青年科学基金项目
批准号：61202144
申请代码：F020508
项目来源：国家自然科学基金
研究期限：2013-01-01-2015-12-31

项目负责人：杨帆
依托单位：厦门大学
批准年度：2012

中文摘要：

高维特征选择的稳定性是一个重要而又尚未解决的难题。已有的特征选择研究主要关注学习机器的预测准确率和计算效率，以准确率及其相关指标作为评价特征选择结果的依据。然而在高维数据空间中，训练数据集上的微小变化会造成特征选择结果的不稳定和不可靠。本项目以基因表达数据为研究对象，从高维数据空间和基因表达数据的分布特点出发，分析高维数据特征选择不稳定性的可能来源，以改善其稳定性和可靠性。研究内容包括通过分析高维数据分布的特点，建立特征选择的稳定性指标；通过对经典特征选择算法的分析，研究基于目标函数的特征评价准则；考虑到特征之间的关联性，提出基于隐变量模型的特征选择策略；针对数据分布的局部性，设计基于分解的多分类特征选择方法；进一步考虑到类内分布的多样性，提出"聚类-特征选择"的递归式局部特征选择策略。本项目的研究成果将提升高维特征选择的稳定性，并将应用到基因选择、基因调控网络和癌症亚型的发现中。

中文主题词：高维数据；特征选择；稳定性；基因表达数据；

结论摘要：

英文主题词high dimensional data；feature selection；stability；gene expression data；

成果综合统计

期刊论文
会议论文
专利
获奖
著作

15
6
0
0
0

Structure damage detection based on random forest recursive feature elimination

Using the Maximum Between-Class Variance for Automatic Gridding of cDNA Microarray Images

Algorithmic randomness based feature selection for traditional Chinese chronic gastritis diagnosis

Reliable Multi-Label Learning via Conformal Predictor and Random Forest for Syndrome Differentiation

An Experimental Study of the Intrinsic Stability of Random Forest Variable Importance Measures

Comparison of Metatranscriptomic Samples Based on k-Tuple Frequencies

Two approaches for novelty detection using random forest

GASS: genome structural annotation for Eukaryotes based on species similarity

Effect of k-tuple length on sample-comparison with high-throughput sequencing data

知识图谱学习和推理研究进展

Structural damage detection based on posteriori probability support vector machine and Dempster-Shaf

一种基于RNA-Seq的基因组注解评估方法

会议论文

A revisit to the class imbalance learning with linear support vector machine

Classification of diabetes disease using TCM electronic nose signals and ensemble learning

Local clustering Conformal Predictor for imbalanced data classification

Stable feature selection with ensembles of multirelieff

Exploring of clustering algorithm on class-imbalanced data

Constrained K-means with external information

相关项目

基于因果关系推断的致病基因发现算法研究

期刊论文 24 会议论文 5 获奖 2

梁板壳动力分析的稳定子域积分高效无网格法研究

期刊论文 35 会议论文 11

蛋白质药物溶液稳定性的试验方法与理论基础

期刊论文 11

深埋地下洞室群围岩的变形机理与稳定性评判准则研究

期刊论文 22 会议论文 4

超空泡流动结构与稳定性研究

期刊论文 64 会议论文 19 获奖 4

考虑地基共同作用影响的大型储液罐体系稳定性研究

期刊论文 14 会议论文 4 专利 1

多标记数据分类及其特征选择算法研究

期刊论文 16 会议论文 5

受限条件下贵金属团簇的稳定性与催化活性的关系

期刊论文 37

基于新型rotaxane 分子薄膜的超高密度信息存储

期刊论文 16

杨帆的项目