位置:成果数据库 > 期刊 > 期刊详情页
一种基于EVS相似度的邮件社区聚类方法
  • ISSN号:1671-9352
  • 期刊名称:山东大学学报(理学版)
  • 时间:0
  • 页码:34-40
  • 语言:中文
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]郑州大学信息工程学院,河南郑州450052
  • 相关基金:国家自然科学基金资助项目(60773048)
  • 相关项目:IB算法及其应用的研究
中文摘要:

聚类方法的核心是如何度量事物间的邻近性。介绍了邮件特征的向量表示形式、构建了邮件特征矩阵,并使用变形后的极值分布函数模型拟合了邮件间通信特征信息;在此基础上提出了一个新的邻近性度量方法(ex-treme value distribution similarity,EVS),用以指导邮件社区划分;使用微聚类-宏聚类邮件社区划分算法验证了该方法的有效性。实验表明,在测试数据集上,相比余弦、PCC等经典的邻近性度量方法,以EVS作为划分依据的邮件社区划分算法能够更加有效地发现高质量的邮件社区。

英文摘要:

Proximity measurement between objects is a key problem of the clustering method.The email feature vector was introduced,and the email feature matrix was constructed.The information of email features was fitted by the model of the transformed extremal value distribution function.Based on this,EVS(extreme value distribution similarity) was proposed for email community clustering.The effectiveness of the new measurement was verified by the micro-macro clustering algorithm.Experiments show that compared to cosine-based similarity and Pearson correlation coefficient,the algorithm using the new proposed similarity measurement can identify higher quality communities.

同期刊论文项目
期刊论文 35 会议论文 7
同项目期刊论文
期刊信息
  • 《山东大学学报:理学版》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国教育部
  • 主办单位:山东大学
  • 主编:刘建亚
  • 地址:济南市经十路17923号
  • 邮编:250061
  • 邮箱:xblxb@sdu.edu.cn
  • 电话:0531-88396917
  • 国际标准刊号:ISSN:1671-9352
  • 国内统一刊号:ISSN:37-1389/N
  • 邮发代号:24-222
  • 获奖情况:
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),波兰哥白尼索引,德国数学文摘,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘
  • 被引量:6243