网络中由于存在着不同的用户在相近的时间段内访问相同的或相似的内容,造成网络链路上可能有重复数据传输.对跨ISP网络传输的TCP包载荷的重复度进行了测量,并分析了这些重复TCP包载荷的相关特性.分析结果发现,1)基于所采用的数据集,TCP包载荷的包数重复度大约在8%~10%(不包括SYN,ACK报文),按载荷大小计量的重复度约为5%~8%;2)重复包载荷大小的分布具有较强的局部性,主要集中在3个区域:小于50B,略大于500B或大于1400B;3)大多数重复的TCP包载荷数据都源自于少数的IP地址.这些重复载荷对应的上层应用除了正常的网络服务如HTTP,Edonkey外,还包含一些异常情况:如有些高度重复的载荷只是一长串的单个字符(如0x00)或几个字符组成的序列的重复.而这种不正常的载荷组成,说明可能存在某种潜在的异常行为,这种异常的行为模式值得进一步研究.
网络中由于存在着不同的用户在相近的时间段内访问相同的或相似的内容,造成网络链路上可能有重复数据传输.对跨ISP网络传输的TCP包载荷的重复度进行了测量,并分析了这些重复TCP包载荷的相关特性.分析结果发现,1)基于所采用的数据集,TCP包载荷的包数重复度大约在8%~10%(不包括SYN,ACK报文),按载荷大小计量的重复度约为5%~8%;2)重复包载荷大小的分布具有较强的局部性,主要集中在3个区域:小于50B,略大于500B或大于1400B;3)大多数重复的TCP包载荷数据都源自于少数的IP地址.这些重复载荷对应的上层应用除了正常的网络服务如HTTP,Edonkey外,还包含一些异常情况:如有些高度重复的载荷只是一长串的单个字符(如0x00)或几个字符组成的序列的重复.而这种不正常的载荷组成,说明可能存在某种潜在的异常行为,这种异常的行为模式值得进一步研究.