位置:成果数据库 > 期刊 > 期刊详情页
高维生物学数据两阶段组合降维策略研究
  • ISSN号:1002-3674
  • 期刊名称:中国卫生统计
  • 时间:2012.10.10
  • 页码:626-629
  • 分类:R739.4[医药卫生—肿瘤;医药卫生—临床医学]
  • 作者机构:[1]南京医科大学公共卫生学院流行病与卫生统计学系,210029, [2]南京医科大学现代毒理学教育部重点实验室,210029, [3]昆山市卫生监督所,215300
  • 相关基金:国家自然科学基金(81072389,30901232);江苏省高校自然科学研究重大项目(10KJA330034)资助;江苏高校优势学科建设工程资助
  • 相关项目:全基因组关联研究中的降维策略和统计分析方法研究
中文摘要:

目的探讨高维生物学数据的多阶段组合降维策略。方法以微阵列数据的判别分析为例,采用实际数据和模拟数据相结合的方法,提出“初步选维→进→步降维”的两阶段组合降维策略,并与后续的“判别一验证”相结合,形成了“选维→降维→判别→验证”的判别分析思路。以后续判别分析的预测效果、预测结果的稳定性与敏感性等为指标,对2种单→降维(PCA,PLS)方法和4种组合降维方法(PCA+SIR、PCA+SAVE、PLS+SIR和PLS+SAVE)进行了考察。结果从判别模型的预测效果、预测结果的稳定性及敏感性来看,PLS优于PCA,PLS+SIR/SAVE的组合降维效果更佳。结论用t计分法选维,以“PLS+SIR/SAVE”法进行降维的两阶段组合降维策略,对于微阵列数据判别分析,是实用的、可行的。

英文摘要:

Objective To explore multi-stage combinational dimension reduction strategy for analyzing high-dimensional data in biology field. Methods Two-stage combinational strategy incorporated in a four- step procedure, i. e. "variable pre-selection→further dimensionality reduction→discrimination→validation", was put forward and applied to publicly available microarray data as well as simulated ones. In this process, the rela- tive performances of six dimension reduction methods, including PCA, PLS ,PCA + SIR,PCA + SAVE ,PLS + SIR and PLS + SAVE, were evalua- ted. Results Considering the prediction quality, the stability of the pre- diction results as well as the sensitivity to the number of genes: ( 1 ) PLS performed was superior to PCA; (2) PLS + SIR or PLS + SAVE performed much better than other methods. Conclusion The results indicate that two stage combinational strategy proposed, i. e. variable pre-selection based on t-scores followed by PLS + SIR or PLS + SAVE,is feasible and practical in the discriminate analysis for microarray data.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中国卫生统计》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国卫生和计划生育委员会
  • 主办单位:中国卫生信息学会 中国医科大学
  • 主编:孟群
  • 地址:沈阳市沈北新区蒲河路77号
  • 邮编:110122
  • 邮箱:zgwstj@126.com
  • 电话:024-31939626
  • 国际标准刊号:ISSN:1002-3674
  • 国内统一刊号:ISSN:21-1153/R
  • 邮发代号:8-39
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:20780