网络的匿名体制(即每个社会个体会以不同的匿名身份活跃于各种网络社区)一方面将充分保障用户的个人隐私,另一方面也将极大地增加网络社会的管理风险,如何在这两者之间进行折中,将是网络时代一个重要的课题,而该课题的关键点就是如何对同一个体在不同网络社区的匿名身份进行串联对应。本项目从图论的观点出发,将每一个网络社区的内部通讯数据描述成一个复杂网络,进而将用户在各个网络社区的身份串联问题转换成不同复杂网络之间的节点匹配问题,并利用各网络社区注册数据揭示的"已匹配节点对"提供的信息,借助于复杂网络理论中已有的结构分析方法来构建一种实现不同网络之间节点匹配的理论框架,并提出一种具有高度实时性与准确性的匹配算法。此研究在未来以较低风险管理网络社会,勾勒网络边界从而降低Internet行业重复性投资,以及在指导行业间合作和保障网络信息安全等方面均具有重要意义。
complex network;node matching;weighted network;interative algorithm;structural symmetry
因特网的匿名体制一方面将充分保障用户的个人隐私,另一方面也将极大地增加网络社会的管理风险,如何在这两者之间进行折中,将是网络时代一个重要的课题,而该课题的关键点就是如何对同一个体在不同网络社区的匿名身份进行串联对应。通过将不同网络社区的通讯数据描述成不同的复杂网络,上述身份识别问题可转换为复杂网络间的节点匹配问题,从而可纳入复杂网络理论体系下进行研究。不仅如此,复杂网络间节点匹配也是当前多学科交叉研究热点课题之一,其应用背景还包括跨网络信息过滤,同源蛋白质发现,以及多语言自动翻译等。本项目经过三年时间的研究提出了利用复杂网络结构信息实现不同网络之间节点匹配的理论框架。在此框架下,设计了两种已匹配节点对选择策略;提出了包括一对一最优节点匹配算法,一对一迭代节点匹配算法,一对多迭代节点匹配算法,以及一对一权重迭代节点匹配算法等四种节点匹配算法;并将这些匹配算法在仿真的随机网络对,小世界网络对,无标度网络对,以及实际的阿里巴巴通讯和好友网络对,开源软件通讯和合作网络对,英汉语言网络对上进行了测试与比较。我们发现一对一迭代节点匹配算法具有线性计算复杂度,并且该算法在无标度网络对上能够以极少的已匹配节点对取得很高的匹配精度;此外,当目标网络对具有较高的局部结构对称性时,一对多迭代节点匹配算法和权重迭代节点匹配算法能够显著地提高匹配精度。自本项目资助开始至今,课题组共发表基金资助的复杂网络及数据挖掘相关学术论文8篇,其中6篇被SCI收录,1篇被EI收录;论文中有三篇发表在本领域Top期刊Physical Review E上;申请了1项国家发明专利,目前已受理;所有的节点匹配算法已开发成软件,并已授权1项节点匹配软件著作权。通过本项目的实施,共培养了2名博士生以及4名硕士生,组织研究生参加了3次全国复杂网络会议。整体而言,超额完成了预定目标。这些研究成果一方面可以帮助我们更好地理解多层网络的协同演化机制,另一方面在跨平台社交网络信息过滤,同源蛋白质发现,以及古文字自动翻译等方面同样具有重要的潜在应用价值。