位置:成果数据库 > 期刊 > 期刊详情页
微阵列数据中的先验信息对基于LASSO变量选择方法影响的模拟研究
  • ISSN号:1002-3674
  • 期刊名称:《中国卫生统计》
  • 时间:0
  • 分类:R739.4[医药卫生—肿瘤;医药卫生—临床医学]
  • 作者机构:[1]重庆医科大学公共卫生与管理学院卫生统计与信息管理教研室,400016
  • 相关基金:国家自然科学基金(81373103),重庆市科委基础与前沿研究计划项目(cstc2013jcyjA10009)
中文摘要:

目的 探讨微阵列数据中的先验信息对基于LASSO变量选择方法的影响。方法 设置真实模型后,逐步融合先验信息,采用R、MATLAB软件编程,模拟比较先验信息对LASSO,group LASSO(简称为g LASSO)中的non-overlap group LASSO(简称为nog LASSO)和overlap group LASSO(简称为og LASSO)变量选择的影响。结果 经典的LASSO、og LASSO变量选择方法在处理模拟微阵列数据时具有较好的预测精度(AUCLASSO=0.8915≈AUCog LASSO=0.8923〉AUCnog LASSO=0.8396,MSEnog LASSO=0.1358〉MSEog LASSO=0.0975≈MSELASSO=0.0928),LASSO可解释性最强(平均入选模型基因数分别为21.52、111.95、101.01)。nog LASSO在处理基因通路信息时,当[X295]被错分至第19个通路后,尽管未改变其效应值,但入选模型次数大为减少,预测精度下降较为明显,而og LASSO表现更稳健。结论 融合微阵列数据中的先验信息并未提高基于LASSO变量选择方法的预测性能及效率,经典的LASSO变量选择方法仍为处理微阵列数据的有效方法。

英文摘要:

Objective Objective To explore the influence of prior information of microarray data on variable selection based on LASSO. Methods After setting the true model, we incorporated prior information into LASSO, non - overlap group LASSO( nogLASSO for short)and overlap group LASSO( ogLASSO for short) variable selection models and compared the influence by MATLAB or R software. Results LASSO、ogLASSO models seemed to have good prediction accuracy when processing microarray data ( AUCLASSO = 0. 8915 ≈ AUCogLASSO = 0. 8923 〉 AUCnogLASSO = 0. 8396, MSEnogLASSO = 0. 1358 〉 MSEogLASSO≈ 0. 0975 ≈ MSELASSO≈ 0. 0928 ), while only LASSO achieved a interpretable model ( The average of genes selected in the models :21.52,111.95,101.01 respectively). When [ X295 ] was misclassified into 19th pathway, the average of genes selected in the models decreased and the forecast precision declined by nogLASSO model, while ogLASSO model's performance seemed to be more robust. Conclusion Incorporating prior information of microarray data does not improve the prediction performance and efficiency of variable selection based on LASSO, therefore the simple LASSO regression model may be an efficient means to deal with microarray data.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中国卫生统计》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国卫生和计划生育委员会
  • 主办单位:中国卫生信息学会 中国医科大学
  • 主编:孟群
  • 地址:沈阳市沈北新区蒲河路77号
  • 邮编:110122
  • 邮箱:zgwstj@126.com
  • 电话:024-31939626
  • 国际标准刊号:ISSN:1002-3674
  • 国内统一刊号:ISSN:21-1153/R
  • 邮发代号:8-39
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:20780