位置:成果数据库 > 期刊 > 期刊详情页
一种基于粗糙集的微博文本特征选择方法
  • ISSN号:1671-1815
  • 期刊名称:科学技术与工程
  • 时间:2013
  • 页码:9830-9834
  • 分类:TP391.31[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]湖南工业大学计算机与通信学院,株洲412007
  • 相关基金:国家自然科学基金资助项目(61170102)、湖南省自然科学基金资助项目(10JJ3002)、国家社科基金资助项目(12BYY045)、教育部人文社会科学研究青年基金资助项目(09YJCZH019)资助
  • 相关项目:黎曼流形上基于均值偏移的逆半调研究
中文摘要:

对中文微博中主客观分类特征的选取进行了研究.通过词典与统计相结合的方法提取了基础情感词、语气词、程度词等8个候选特征.对提取的候选特征,提出了一种基于粗糙集与概率加权的特征选择算法,通过该算法最终选取了基础情感词、!或!、网络观点词、语气词、形容词、程度词作为分类特征.实验结果表明,提出的方法能达到较好的分类效果.

英文摘要:

The feature selection of subjective and objective classification of Chinese micro blog habeen stud- ied. Fothe featurein Chinese micro blog, the combination of lexicon and statisticiused to extraccandidate features. By thimethod, eighcandidate featureare extracted. And feature selection algorithm based on rough setand probability-weighted iproposed. Using the algorithm, six featureare selected. The experimenresulshowthathese featureselected by the algorithm achieve good resulin subjective and objective classification of Chinese micro blog.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《科学技术与工程》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国技术经济学会
  • 主编:明廷华
  • 地址:北京市学院南路86号
  • 邮编:100081
  • 邮箱:ste@periodicals.net.cn
  • 电话:010-62118920
  • 国际标准刊号:ISSN:1671-1815
  • 国内统一刊号:ISSN:11-4688/T
  • 邮发代号:2-734
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国科技核心期刊,中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:29478