位置:成果数据库 > 期刊 > 期刊详情页
一种基于相关系数的多层邮件过滤系统
  • ISSN号:1001-3695
  • 期刊名称:《计算机应用研究》
  • 时间:0
  • 分类:TP393[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]河海大学计算机信息与工程学院,南京210098, [2]河海大学信息中心,南京210098, [3]南京邮电大学计算机学院,南京210003, [4]北京市电信工程局有限公司,北京100061
  • 相关基金:国家自然科学基金资助项目(60805022); 国家“863”高技术研究发展计划资助项目(2007AA01Z178); 南京邮电大学青兰计划(NY206034)
中文摘要:

多个相关任务同时学习可能比各个任务单独学习具有更好的泛化能力,这是多任务学习(multitask learning)模式的出发点。受其启发,研究并开发了一种多层邮件过滤系统。首先为各用户建立基本分类器,利用EM算法估计出基本分类器之间的相关系数,最终得到该用户的邮件过滤判别函数。实验结果表明,该系统对中英文语料都是可靠和有效的,并在样例较少时就具有较好的过滤性能。该过滤系统的优劣最终还取决于相关系数先验概率的参数取值,以及所选择的基本分类器。

英文摘要:

A group tasks learning simultaneously may have better generalization ability than learning individually,inspired by which,this paper proposed a multilevel spam filter based on correlation coefficient. The system used EM algorithm to estimates the correlation coefficient,by which the system got a spam discriminant. Experiments show that the system is reliable and effective for both Chinese and English corpus. It can get good performance even if given small sample set. The performance of the system ultimately depends on the parameters value of the priori of the correlation coefficient,and the choice of base classifiers.

同期刊论文项目
期刊论文 7 会议论文 5 专利 1
同项目期刊论文
期刊信息
  • 《计算机应用研究》
  • 北大核心期刊(2011版)
  • 主管单位:四川省科学技术厅
  • 主办单位:四川省计算机研究院
  • 主编:刘营
  • 地址:成都市成科西路3号
  • 邮编:610041
  • 邮箱:arocmag@163.com
  • 电话:028-85210177 85249567
  • 国际标准刊号:ISSN:1001-3695
  • 国内统一刊号:ISSN:51-1196/TP
  • 邮发代号:62-68
  • 获奖情况:
  • 第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:60049