位置:成果数据库 > 期刊 > 期刊详情页
基于文本挖掘词频反文档频率方法的疾病症状权重挖掘研究
  • ISSN号:1671-1742
  • 期刊名称:成都信息工程学院学报
  • 时间:2014.2.15
  • 页码:52-58
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]成都信息工程学院计算机系,四川成都610225, [2]成都信息工程学院软件工程系,四川成都610225, [3]成都中医药大学,四川成都610075
  • 相关基金:国家重点基础研究(973)计划子课题资助项目(2012CB518500);国家自然科学基金资助项目(61202250,61203172);四川省教育厅青年基金资助项目(11ZB088);四川省应用基础计划资助项目(2012JY0112);四川省科技支撑计划资助项目(2011SZZ027);感谢成都市科技计划项目(12DXYB100JH-002);成都信息工程学院中青年学术带头人科研基金(J201208,J201101);成都信息工程学院引进人才项目KYTZ201110,KYTZ201111)对本文的资助
  • 相关项目:社群大规模协作认知规律和演化模型挖掘
中文摘要:

词频反文档频率是文档特征权值表示的常用方法,用以评估单词对于语料库中的其中一份文件的重要程度.通过合理映射病例库与语料库的词汇关系,对词频反文档频率模型进行改进,并将改进后的词频反文档频率模型应用到针灸处方疾病症状权重挖掘中,计算出疾病所对应的各种症状权重.实验统计了106种疾病,其中与临床诊疗经验相符合的有84种,准确率达79.2%,实验表明改进的模型能得到较好的疾病症状权重鉴别效果.

英文摘要:

Term frequency-inverse document frequency is commonly used to calculate document feature weight values, such as to evaluate the importance of words in one document of the corpus. This paper improves the TF-IDF model by reasonably mapping the words relationship between case library and the corpus. It also applies the improved MAPTF-IDF model to acupuncture and moxibustion prescription to calculate the TCM symptom weights. The exper- iment analyzes 106 types of diseases; in which 84 types of diseases are consistent with clinical diagnosis. The accuracy rate is 79.2 %. Experiment results show that the improved model can achieve better identification effect.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《成都信息工程大学学报》
  • 主管单位:成都信息工程大学
  • 主办单位:成都信息工程大学
  • 主编:朱明
  • 地址:四川省成都市西南航空港经济开发区学府路一段24号
  • 邮编:610225
  • 邮箱:xbbjs@cuit.edu.cn
  • 电话:028-859666755 85966485
  • 国际标准刊号:ISSN:1671-1742
  • 国内统一刊号:ISSN:51-1625/TN
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:9