基于模型集群分析技术的变量选择与模型评价新方法研究-东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：立项数据库 > 立项详情页

基于模型集群分析技术的变量选择与模型评价新方法研究

项目名称：基于模型集群分析技术的变量选择与模型评价新方法研究
项目类别：面上项目
批准号：21075138
申请代码：B0512
项目来源：国家自然科学基金
研究期限：2011-01-01-2013-12-31

项目负责人：梁逸曾
负责人职称：教授
依托单位：中南大学
批准年度：2010

中文摘要：

现代仪器分析数据的一个显著特点就是变量(波长或质荷比等)的数量远远超过样本的数量，也就是统计学家们所称的"small n, large p"问题。为防止过拟合和建立一个易于解释的可靠的数学模型，变量选择和模型评价变得尤为重要。然而，从成千上万的变量中选出有信息的变量和模型评价是一个具有挑战性，也是化学计量学研究中的基础性的问题，均尚未得到有效解决。本项目拟基于本研究小组新近提出的模型集群分析技术,建立高维数据的变量选择和模型评价新方法，能在很大程度上克服"组合爆炸"问题，快速可靠地从众多候选变量中筛选出有信息的变量，并对基于所选变量建立的数学模型进行可靠性评价。最后，将所建立的新方法用于现代组学临床数据(基因组数据，蛋白组数据和代谢组数据)的分析，以期能够为生物标记物的发现奠定方法学基础，并能为临床实践，如疾病诊断和预测提供新方法。

中文主题词：化学计量学；模型集群分析；变量选择；稳健方法；模型评价

英文摘要：

chemometrics；model population analysis；variable selection；robust method；model evaluation

英文主题词： chemometrics；model population analysis；variable selection；robust method；model evaluation

结论摘要：

本项目主要针对我们自主提出的模型集群分析思路，进行了系统的化学计量学基础及新算法研究，经过三年的研究，已在以下三个方面取得显著成果1）对模型集群分析的框架进行了科学定义，提出四个空间, 即样本空间、变量空间、参数空间和模型空间，突出了核心，奠定了其理论基础；2）针对化学和生物学中的高维数据（包括化学建模、代谢组学、蛋白组学等），在稳健分析、变量选择及模型评价等方面，发展了一系列有影响的化学计量学的新方法，取得显著成果；3）将本项目成果应用于复杂体系的仪器分析数据解析，说明本项目成果不但为化学建模，解决代谢组学与蛋白组学等领域的分析难题提供了新的化学计量学算法，而且为化学计量学的后续发展提供了理论与实践的框架和思路。

成果综合统计

成果类型

数量

期刊论文
会议论文
专利
获奖
著作

82
0
0
0
1

期刊论文

Random frog: An efficient reversible jump Markov Chain Monte Carlo-like approach for variable select

Investigation of Scrambled Ions in Tandem Mass Spectra. Part 1. Statistical Characterization

Model-population analysis and its applications in chemical and biological modeling

Prediction of retention indices for frequently reported compounds of plant essential oils using mult

Variable complementary network: a novel approach for identifying biomarkers and their mutual associa

ChemoPy: freely available python package for computational biology and chemoinformatics

Chromatographic fingerprint of Semen Armeniacae Amarae based on high-performance liquid chromatogram

GC-MS Based Serum Metabolomic Analysis of Isoflurane-Induced Postoperative Cognitive Dysfunctional R

A comprehensive investigation of proline fragmentation behavior in low-energy collision-induced diss

Identification of Fatty Acids in Vegetable Oils by Mass Spectrometry and Equivalent Chain Length

Chemical fingerprinting of Su-He-Xiang-Wan and attribution of major characteristic peaks for its qua

Simultaneous determination mercury species of Su-He-Xiang-Wan in rat tissues by HPLC-CVG-AFS

Detection and Identification of Extra Virgin Olive Oil Adulteration by GC-MS Combined with Chemometr

CHEMICAL FINGERPRINT ANALYSIS FOR QUALITY CONTROL OF Herba Ephedrae BASED ON HPLC-DAD COMBINED WITH

Application of Competitive Adaptive Reweighted Sampling Method to Determine Effective Wavelengths fo

Using core hydrophobicity to identify phosphorylation sites of human G protein-coupled receptors

Large-scale prediction of drug–target interactions using protein sequences and drug topologica

Tree-based ensemble methods and their applications in analytical chemistry

QSRR Study on Flavor Compounds of Diverse Structures on Different Columns with the Help of New Chemo

A model population analysis method for variable selection based on mutual information

Application of fast Fourier transform cross-correlation and mass spectrometry data for accurate alig

Comparisons of Five Algorithms for Chromatogram Alignment

Investigation of Scrambled Ions in Tandem Mass Spectra, Part 2. On the Influence of the Ions on Pept

Morphological weighted penalized least squares for background correction

Effects of injection volume on chromatographic features and resolution in the process of counter-cur

Correlation and prediction of partition coefficient using nonrandom two-liquid segment activity coef

Nonlinear alignment of chromatograms by means of moving window fast Fourier transfrom cross-correlat

电性距离矢量预测有机污染物的生物富集因子

阱基单胺氧化酶抑制剂抑制活性的定量构效关系

An efficient method of wavelength interval selection based on random frog for multivariate spectral

propy: a tool to generate various modes of Chou's PseAAC

Genome-Scale Screening of Drug-Target Associations Relevant to K-i Using a Chemogenomics Approach

HUMAN PLASMA METABOLIC PROFILES OF CORONARY HEART DISEASE BY GAS CHROMATOGRAPHY-MASS SPECTROMETRY WI

Classification of vinegar samples based on near infrared spectroscopy combined with wavelength selec

Large-scale prediction of human kinase-inhibitor interactions using protein sequences and molecular

The continuity of sample complexity and its relationship to multivariate calibration: A general pers

INVESTIGATION OF CHEMICAL COMPONENTS VARIATION IN MAXING SHIGAN DECOCTION BY HPLC-DAD

Comparison of quantitative structure-retention relationship models on four stationary phases with di

质谱特征结合等效链长定性分析植物油中的脂肪酸

Simultaneous determination mercury species of Su-He-Xiang-Wan in rat tissues by HPLC-CVG-AFS

脐橙果酒香气成分色谱保留时间的定量构效关系

细风轮菜挥发油的定量结构-色谱保留关系

多酚类化合物抗氧化活性的电拓扑模型

嘧啶苯磺酰脲衍生物对小麦纹枯病菌体外抑菌活性的QSAR研究与分子设计

电感耦合等离子体质谱法测定硅藻土助滤剂中的重金属元素

ICP-MS法研究重度烧伤患者创面肉芽组织中微量元素的亚细胞分布

氯代苯胺对斑马鱼的急性毒性的电性拓扑研究

取代喹啉类化合物抗菌活性的3D-QSAR研究及分子设计

新烟碱类杀虫剂生物活性的理论研究和结构修饰

吡啶酰氨磺酰胺衍生物杀菌活性的理论研究

柴油中微量硫的发射光谱研究

ORS-ICP-MS测定工业污泥中的重金属元素

直接进样ICP-OES法测定N-甲基吡咯烷酮（NMP）中的12种杂质元素

Determination of trace elements in high purity nickel by high resolution inductively coupled plasma mass spectrometry

用手性连接性指数预测手性有机酸的保留指数

食品香味化合物香味强度的构效关系

苯异丙基胺类兴奋剂兴奋强度理论研究

手性三唑类化合物的QSRR研究

茶叶上农药生物降解性的电性距离矢量预测

新三取代嘧啶苯磺酰脲衍生物除草活性的QSAR

3-取代硫基-5-(2-羟基苯基)-4H-1,2,4-三唑类化合物抑菌活性的定量构效关系和结构修饰的理论研究

A perspective demonstration on the importance of variable selection in inverse calibration for compl

电感耦合等离子体质谱法直接测定蜂胶中重金属元素

Chemical fingerprinting of Su-He-Xiang-Wan and attribution of major characteristic peaks for its quality control by GC-MS

93号汽油组分的GC／MS研究

Trace amounts of impurities in electrolytic manganese metal by sector field inductively coupled plasma mass spectrometry

SCR脱硝尿素中微量元素的质谱法测定

硫色烯并噻唑胺类衍生物对乙酰胆碱酯酶抑制活性的QSAR模型

食用橄榄油中重金属元素的质谱分析

金莲花挥发性组分色谱保留值的构效关系研究

ICP-MS法研究肺癌组织中微量元素亚细胞分布

氯代芳烃生物降解性的QSBR研究

手性有机酸薄层色谱保留指数的拓扑模型

木香花挥发油组分的定量结构-保留相关性

密蒙花挥发油成分的定量结构与色谱保留关系研究

ICP-OES法测定密蒙花中多种元素

高分辨电感耦合等离子体质谱法测定食品膨松剂中的杂质元素

苯并噻（噁）唑酮衍生物杀虫活性的理论研究

应用电感耦合等离子体质谱研究硅灰中的重金属元素

3-取代硫基-5-（2-羟基苯基）-4H-1，2，4-三唑类化合物抑菌活性的QSAR研究

电感耦合等离子体质谱法测定石油焦中18种金属元素

呋虫胺衍生物杀虫活性的理论研究

著作

复杂体系仪器分析——白、灰、黑分析体系及其多变量解析方法

相关项目

半导体制造中的高级统计过程控制算法研究

期刊论文 11

不完全数据半参数回归模型的统计分析及其应用

期刊论文 4 会议论文 2

纵向数据单指标混合效应模型的有效统计推断

期刊论文 39

复杂数据下变系数模型的统计推断及应用

期刊论文 17 会议论文 1

稳健季节调整的信号提取理论与应用研究

期刊论文 7

大黄有效部位治疗缺血性脑中风的多目标优化及血、脑药代动力学相关性研究

期刊论文 17 会议论文 5

期刊论文 77 会议论文 11

中药药效组分的指纹图谱分析方法研究

期刊论文 265 会议论文 61 获奖 6 著作 14

多元时间序列的特征表达及模型优化

期刊论文 46 会议论文 18 著作 2

梁逸曾的项目

化学建模中若干重要问题的基础研究

期刊论文 7

系统化学生物学数据库的基础研究

期刊论文 34 会议论文 10

蛋白组学中LC-MS/MS数据的统计分析的新型算法研究

期刊论文 48 著作 1

中药药效组分的指纹图谱分析方法研究

期刊论文 265 会议论文 61 获奖 6 著作 14

2001年GORDON会议“化学与化工中的统计学研究”

期刊论文 3

第十五届国际化学计量学大会

分析化学中数据发掘的化学计量学新方法研究

期刊论文 16

亚洲化学计量学和生物信息学国际会议

亚洲化学计量学、生物信息学国际会议