位置:成果数据库 > 期刊 > 期刊详情页
基于最大相关最小冗余朴素贝叶斯分类器的应用
  • ISSN号:1002-3674
  • 期刊名称:《中国卫生统计》
  • 时间:0
  • 分类:R319[医药卫生—基础医学]
  • 作者机构:重庆医科大学公共卫生与管理学院医学与社会研究中心健康领域社会风险预测治理协同创新中心,400016
  • 相关基金:国家自然科学基金(81373103);重庆市科委基础与前沿研究计划项目(cstc2013jcyjA10009)
中文摘要:

目的 将基于最大相关最小冗余(maximum relevance minimum redundancy,MRMR)的朴素贝叶斯分类器(naive bayesian classifier,NBC)应用于基因表达数据并与经典NBC、随机森林(random forests,RF)进行比较。方法 采用Matlab与R软件编程,应用结肠癌与肺癌基因表达数据集,分别采用上述三种方法进行比较研究,使用10-折交叉验证方法估计经典NBC与RF的分类准确率。结果 应用MRMR-NBC分析结肠癌基因表达数据集显示,采用信息熵(mutual information quotient,M IQ)法,当特征m=11时分类准确率达93.55%;而采用信息差(mutual information difference,M ID)法时,当m=15时分类准确率达到95.16%。应用MRMR-NBC分析肺癌基因表达数据集显示,采用MIQ法,当m=14时分类准确率最高达98.63%,而采用MID法时当m=12时分类准确率达到97.26%。而采用经典NBC分析结肠癌与肺癌基因表达数据时,分类准确率分别为66.67%、80.00%;RF在分析结肠癌与肺癌基因表达数据时,分类准确率分别为81.89%、77.62%。结论 M RM R-NBC能在仅有极少属性参与分类时,得到较高的分类准确率,优于经典NBC与RF。

英文摘要:

Objective To apply Naive Bayesian classifier with Maximum Relevance Minimum Redundancy(MRMR) feature selection methods into gene expression data, and to compare it with Naive Bayesian classifier( NBC ) and Random Forests (RF). Methods The three methods were applied to classify the colon and lung genes by Matlab and R software. 10-fold cross-validation was used to estimate the classification accuracy. Results When applying MRMR-NBC method to classify the colon genes,the classification accuracy reached 93.55% with features with mutual information quotient(MIQ) ,95.16% with with mutual information difference(MID). When applying MRMR-NBC method to classify the lung genes ,the classification accura- cy reached 98.63% with with MIQ,97. 26% with with MID. When applying NBC to classify both of the colon and lung genes, the classification accuracy reached 66. 67% and 80. 00% ; when applying Random Forests to classify both of the colon and lung genes,the classification accuracy reached 81.89% and 77.62%. Conclusion The classification accuracy of MRMR-NBC can reach higher than NBC and RF with fewer features.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中国卫生统计》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国卫生和计划生育委员会
  • 主办单位:中国卫生信息学会 中国医科大学
  • 主编:孟群
  • 地址:沈阳市沈北新区蒲河路77号
  • 邮编:110122
  • 邮箱:zgwstj@126.com
  • 电话:024-31939626
  • 国际标准刊号:ISSN:1002-3674
  • 国内统一刊号:ISSN:21-1153/R
  • 邮发代号:8-39
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:20780