位置:成果数据库 > 期刊 > 期刊详情页
基于改进隐马尔可夫模型的文本分类研究
  • ISSN号:1000-7180
  • 期刊名称:微电子学与计算机
  • 时间:2012.11.5
  • 页码:161-165
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]扬州大学信息工程学院,江苏扬州225127, [2]扬州大学水利科学与工程学院,江苏扬州225127
  • 相关基金:国家自然科学基金项目(61170201)
  • 相关项目:面向本体映射的在线语义连接子研究
中文摘要:

将一种改进的隐马尔可夫模型(HMM)应用于文本分类中,在考虑其前向依赖的同时,需考虑状态的后向依赖性.将当前观测值和和当前状态对其后一状态的依赖性加入模型的学习,这样的改进模型能有效提高文本信息抽取准确率.在文本分类过程研究中,首先对训练样本进行文本预处理,对HMM分类器模型进行参数学习,建立HMM分类器后用测试集进行测试并做出性能评价.在性能评价中用改进的评测指标,可针对不同数据集做出准确评价,以及可对比不同分类工作在同一数据集上的性能,大大提高评价质量.

英文摘要:

The application of the improved Hidden Markov Models to text categorization should take the backward dependency as well as forward dependency on states into account.The accuracy of information extraction could be improved by applying the dependency of the current observation value and state on the backward ones into the learning of models.This paper is to preprocess the training samples in text categorization process,to learn the parameters of HMM classifier,establishing one and evaluating its performance through testing set.The improved evaluation criteria could give a fair evaluation of different dataset,make a comparison of different classifiers on the performance of the same dataset and feed back the classifier to improve.

同期刊论文项目
期刊论文 37 会议论文 10 获奖 2
同项目期刊论文
期刊信息
  • 《微电子学与计算机》
  • 中国科技核心期刊
  • 主管单位:中国航天科技集团公司
  • 主办单位:中国航天科技集团公司第九研究院第七七一研究所
  • 主编:李新龙
  • 地址:西安市雁塔区太白南路198号
  • 邮编:710065
  • 邮箱:mc771@163.com
  • 电话:029-82262687
  • 国际标准刊号:ISSN:1000-7180
  • 国内统一刊号:ISSN:61-1123/TN
  • 邮发代号:52-16
  • 获奖情况:
  • 航天优秀期刊,陕西省优秀期刊一等奖
  • 国内外数据库收录:
  • 荷兰文摘与引文数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:17909