位置:成果数据库 > 期刊 > 期刊详情页
邮件网络协同过滤机制研究
  • ISSN号:0254-4156
  • 期刊名称:自动化学报
  • 时间:2012.3.3
  • 页码:399-411
  • 分类:TP393.098[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北京工业大学计算机学院,北京100124
  • 相关基金:国家自然科学基金(61001178,60905017,61175115),国家软科学研究计划项目(2010GXQ5D317),北京市自然科学基金(4102012,4112009,4102013,4123093),北京市教育委员会科技发展计划面上项目(KM201210005024),北京市教育委员会科技发展计划重点项目(KZ201210005007),北京市高等学校人才强教深化计划“中青年骨干人才培养计划”项日(PHR201108016),北京工业大学高层人才培养项目,北京工业大学校青基金资助
  • 相关项目:面向网络短文本舆情分析的层次化表达与计算机制研究
中文摘要:

基于Enron邮件集合探索真实邮件网络,揭示出邮件网络的无标度特性和有限小世界特性。在此基础上,依据用户间交互强度设计山垃圾邮件协同过滤机制,通过调整参数λ,用户可以决定主要是依靠自己还足其他用户协同进行垃圾信息过滤。算法即使在没有对用户个人阅读习惯充分训练的情况下,也可以通过基于交互强度的网络协同方式实现良好过滤。同时为了解决Enron数据集缺乏标注的情况,基十训练样本集W和测试样本集T独立同分布的假设,利用改进的EM(Expectationmaximization)算法最小化WUT集合上风险函数,给出了未知样本的一个良好标注。真实数据上的实验表明,同单机过滤和集成过滤方法相比,协同过滤能够提高平均过滤精度且方法简单易行。

英文摘要:

A Social network analysis in Enron corpus found that the real e-mail network was a scale-tree ana small woma in some degree. Then a spam collaborative filtering method was designed based on users'interaction. By adjusting the parameter λ, users can decide filtering spam by themselves or others or trade-off between them. Even in the absence of reading habits of users, the collaborative filtering method could achieve good performance. Because the Enron corpus was unlabeled, by adding i.i.d, assumption constraint to training data set W and test data set T, we labeled Enron corpus using improved EM (Expectation maximization) algorithm in a sense of minimum statistical risk in W U T. Experiment results showed that the collaborative filtering method is simple and effective which can steadily increase average accuracy compared with single machine and ensemble filterings.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《自动化学报》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国自动化学会 中国科学院自动化研究所
  • 主编:王飞跃
  • 地址:北京东黄城根北街16号
  • 邮编:100717
  • 邮箱:aas@ia.ac.cn
  • 电话:010-64019820
  • 国际标准刊号:ISSN:0254-4156
  • 国内统一刊号:ISSN:11-2109/TP
  • 邮发代号:2-180
  • 获奖情况:
  • 1997年获全国优秀期刊奖,1985、1990、1996、2000年获中国科学院优秀期刊二等奖,2002年获国家期刊奖
  • 国内外数据库收录:
  • 美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:27550