位置:成果数据库 > 期刊 > 期刊详情页
城管案件短文本特征生成与选择方法及其应用
  • ISSN号:1002-8331
  • 期刊名称:《计算机工程与应用》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]桂林电子科技大学广西信息科学实验中心,广西桂林541004, [2]北京邮电大学自动化学院,北京100876, [3]桂林市智度信息科技有限公司,广西桂林541004
  • 相关基金:国家自然科学基金(No.21365008,No.61562013);广西壮族自治区自然科学基金(No.2013GXNSFBA019279);桂林电子科技大学研究生创新项目(No.GDYCSZ201478,No.GDYCSZ201474).
中文摘要:

以智慧城市管理应用系统中的案件上报短文本为对象,研究有效的特征生成和特征选择方法,实现案件快速准确地自动分类。根据案件描述短文本的特点,提出一种互邻特征组合算法,以生成描述力更强的组合特征;为进一步约减特征并优化特征空间,提出一种新的隶属度函数来为分类体系中的每个类别构建一个类别特征域,然后利用类别特征域进一步优化选择原始特征与组合特征,最终得到对分类贡献最高的特征表示集合。以南宁市青秀区“城管通”App中的案例分类为实例,验证提出的特征生成及选择方法,实验表明相对于文档频率、互信息和信息增益,提出的方法对案件分类的准确率更高,引入组合特征能显著提升分类准确率。

英文摘要:

This paper aims to provide effective methods for feature generation and selection so as to automatically categorizingshort text of urban management cases reported by smart city management application system.By analyzing thecharacteristics of the short text,a new adjacent feature combination algorithm is proposed to generate combined featuresbearing more descriptive power.To further reduce and optimize the feature space,a new membership function to constructa class feature domain for each category in the classification system is presented.Then,the category feature domain isapplied to further select both original and combining features to attain optimal feature representation collection with highestsignificance to classification.The city management application of Qingxiu District of Nanning city is used as an example,experimental results show that the feature generation and selection method proposed in this paper has better performancein short text classification compared to the document frequency,mutual information and information gain and other methods,and the introduction of combined features can significantly improve the performance of the short text classification system.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机工程与应用》
  • 北大核心期刊(2014版)
  • 主管单位:中国电子科技集团公司
  • 主办单位:华北计算技术研究所
  • 主编:怀进鹏
  • 地址:北京市海淀区北四环中路211号北京619信箱26分箱
  • 邮编:100083
  • 邮箱:ceaj@vip.163.com
  • 电话:
  • 国际标准刊号:ISSN:1002-8331
  • 国内统一刊号:ISSN:11-2127/TP
  • 邮发代号:82-605
  • 获奖情况:
  • 1. 2012年首批获得中国学术文献评价中心发布的 “...,2. 2001年获得新闻出版署“中国期刊方阵双效期刊”,3. 2008年首批入选国家科技部“中国精品科技期刊...,4.2003年-2011年连续获得工业和信息化部期刊最高...
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:97887