位置:成果数据库 > 期刊 > 期刊详情页
垃圾邮件分类的偏依赖特性研究
  • ISSN号:0372-2112
  • 期刊名称:《电子学报》
  • 时间:0
  • 分类:TP393[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]电子科技大学计算机学院卫士通安全联合实验室,四川成都610054
  • 相关基金:国家863高技术研究发展计划(No.863-104-03-01)
中文摘要:

由于相对于漏报,误报会对邮件过滤性能造成更负面的影响,因此有必要研究如何让邮件过滤器对误报代价表现出更高的敏感性.本文通过引入具有偏依赖特征的权值系数函数,提出了一种能够实现非对称训练学习的改进拟合Logistic Regression邮件分类算法模型.根据在实际邮件样本集上所作测试试验,在分类精度性能没有降低的条件下,验证了新分类模型在误报率和漏报率两项指标之间存在较明显的偏依赖特性,同时对扰动特征数据表现出较强鲁棒特性.

英文摘要:

Since false positive, compared with false negative, would cause much higher negative influence on email filter' s performance,it is necessary to investigate how to make the email filter become more sensitive to handle the cost of false positive. This paper brings forward an advanced fitting Logistic Regression model for spam discrimination by inn:educing a coefficientweighted function which can help to implement unbalanced classifier training. Without performance degradation on classification precision, the results of the performance evaluation on actual email testing sets verify that the new categorization model is of the partial dependent characteristic evidently between the criteria of false positive ratio and false negative ratio. Meanwhile, the testing results suggest that the model is robust to perturbing data as well.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《电子学报》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会
  • 主办单位:中国电子学会
  • 主编:郝跃
  • 地址:北京165信箱
  • 邮编:100036
  • 邮箱:new@ejournal.org.cn
  • 电话:010-68279116 68285082
  • 国际标准刊号:ISSN:0372-2112
  • 国内统一刊号:ISSN:11-2087/TN
  • 邮发代号:2-891
  • 获奖情况:
  • 2000年获国家期刊奖,2000年获国家自然科学基金志项基金支持,中国期刊方阵“双高”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘,中国北大核心期刊(2000版)
  • 被引量:57611