位置:成果数据库 > 期刊 > 期刊详情页
基于失衡数据挖掘的乳腺癌早期辅助检测方法
  • ISSN号:0254-3087
  • 期刊名称:仪器仪表学报
  • 时间:2014.9.15
  • 页码:2045-2052
  • 分类:TP391.77[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术] TH783[机械工程—仪器科学与技术;机械工程—精密仪器及机械]
  • 作者机构:[1]哈尔滨理工大学软件学院,哈尔滨150080, [2]哈尔滨理工大学计算机科学与技术学院,哈尔滨150080, [3]哈尔滨理工大学测控技术与仪器黑龙江省高校重点实验室,哈尔滨150080
  • 相关基金:国家自然科学基金(61103149)、中国博士后科学基金(2011M500682)、黑龙江省自然科学基金(QC2013C060)、哈尔滨市青年科技创新人才专项(2012RFQXG093)资助项目
  • 相关项目:面向失衡数据集的预测分类模型研究
中文摘要:

针对乳腺癌早期X摄片人为难以甄别的问题,提出了一种新的基于失衡数据挖掘的检测方法,为计算机辅助乳腺癌早期诊断提供一套有效的解决方案.首先,提出了基于聚类簇边界采样(CBS)的方法对数据集进行重采样,通过聚类密度阈值和边界密度阈值来更加科学、准确地确定聚类边界指导重采样.其次,引入集成学习思想有效调节数据失衡对SVM分类算法产生的影响.通过在佛罗里达大学的乳腺X摄片图像数据库中进行的对比实验表明该方法与传统方法比较,采用CBS前后的AUC值从0.577提升到0.717,再引入集成学习方法,AUC值提升到0.83.结果表明所提出的方法可以有效地检测出X摄片图像中异常的潜在钙化点,实现辅助医生提高乳腺癌早期诊断的成功率.

英文摘要:

Aiming at the difficulty in the recognization of early breast cancer X radiography,this paper proposes a new detection method based on imbalance data mining,which provides an effective solution for computer aided diagnosis of early breast cancer.Firstly,we propose a method of cluster boundary sampling (CBS),which uses the clustering density threshold and boundary density threshold to determine the cluster boundaries,and guide the process of re-sampling more scientifically and accurately.Then,we adopt the ensemble learning to regulate the influence of data imbalance on SVM classification algorithm.Comparison experiments on the digital database for screening mammography (DDSM) from University of Florida show that compared with the tradition method,after adopting CBS method,the value of AUC increases from 0.577 to 0.717 ; and then by introducing ensemble learning method,the value of AUC increases to 0.83.The results show that the proposed method is able to detect the abnormal potential calcification points effectively and assist doctors to improve the success rate of breast cancer early diagnosis.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《仪器仪表学报》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会
  • 主办单位:中国仪器仪表学会
  • 主编:张钟华
  • 地址:北京东城区北河沿大街79号
  • 邮编:100009
  • 邮箱:yqyb@vip.163.com
  • 电话:010-84050563
  • 国际标准刊号:ISSN:0254-3087
  • 国内统一刊号:ISSN:11-2179/TH
  • 邮发代号:2-369
  • 获奖情况:
  • 1983年评为机械部科技进步三等奖,1997年评为中国科协优秀科技期刊三等奖
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘,中国北大核心期刊(2000版)
  • 被引量:42481