准确地识别网络中对等网络(简称P2P)流量有利于合理利用互联网基础设施,为用户提供服务质量(简称QoS)保证。目前,常见的P2P流量识别的方法难以在计算效率和识别正确率之间保持较好的平衡。本项目以不可分小波核函数支持向量机在对等网络流量识别中的应用为基本背景,以提高P2P流量识别正确率和计算效率为切入点,探索鲁棒性和实时性相融合的P2P流量识别方法。主要内容包括基于时间和信任的流量采样,使能够检测到的信息和过滤效果最大化,提高识别模型性能;将单个流行为特征和多个流之间特征结合来识别P2P流量,引入智能计算技术,更好的选择合适的P2P的流量特征集;构造新的不可分小波,研究基于不可分小波核的支持向量机算法来提高P2P流量识别精度,能够在小样本下、实时高效地识别P2P流量,并将上述研究成果集成到本项目开发的P2P流量识别平台进行分析、对比和验证为P2P流量识别提供理论和技术支持。
P2P networks;traffic identification;Support Vector Machine;non-separable wavelet;trust sampling
P2P流量逐渐成为了互联网流量的重要组成部分。开展高效、准确的P2P流量实时识别与过滤的相关技术研究,有利于合理利用互联网基础设施。当前,电信网络和校园网络中有关P2P流量识别仅用一些较为简单的DPI识别方法,因此本课题中P2P流量识别的相关理论和技术可应用于电信网络和校园网络中。 本项目主要从如下四个方面对本项目展开研究(1)基于信任抽样的P2P流量识别。提出了一阶对数信任抽样策略和二阶贝叶斯信任抽样策略并实现了这两种策略的信任抽样算法。可以较为准确的预测后续抽样周期P2P流量比例的波动程度,可以降低样本冗余。(2)结合智能优化算法的P2P流量特征选择。建立可行的基于SVM的DFI检测模型,将单个流行为特征和多个流之间特征结合来识别P2P流量。提出了融合杜鹃搜索的粒子群算法的P2P流量特征选择,以及基于人工蜂群算法的P2P流量特征选择方法,在众多特征集合中选择出具有最佳分类性能的特征子集。(3)基于智能算法参数优化SVM的P2P流量识别。提出采用融合杜鹃搜索的粒子群算法对支持向量机参数进行优化,以及基于人工蜂群算法对支持向量机参数进行优化,以避免SVM参数优化中计算费时、易陷入局部最优的问题。(4)基于不可分小波核函数SVM的P2P流量识别。提出基于样本密度的自适应SVM核函数训练算法,提出基于ABC和小波SVM的P2P流量识别方法,以及基于菌群和小波SVM的P2P流量识别方法。基于不可分小波核函数的支持向量机具有更高的函数逼近精度和泛化能力;通过自适应的调整不可分小波核函数的参数可以提高分类器的精度和迭代的收敛速度。 本项目取得如下科研成果共发表论文40篇,其中SCI收录4篇,EI收录24篇;国际会论文8篇;申请发明专利2项,实用新型专利授权1项,软件著作权1项;多次参加国际学术会议;培养研究生8人。