互联网用户是真实世界人物的映像,网络用户在虚拟社会的交互行为和发言讨论会直接或间接地反映出其内在的潜藏动机。然而,对于虚拟社会的网络用户,如何发现其密切联系群体,其行为中是否存在诸如指纹的稳定性特征,都还没有专门和深入的研究。本课题面向网络信息安全领域舆情监测的实际需求,针对论坛、博客、微博等互联网交互平台中的用户行为信息进行分析挖掘,首先建立用户之间的交互关系网络,在此基础上研究基于交互信息网络的用户群体发现和用户重要度计算方法,对于自动发现或者重点关注的重要用户从语言风格和兴趣话题两个主要方面进行分析,挖掘网络用户行为的稳定性识别特征,实现对虚拟社会重要用户的同一性识别和准确追踪,为舆情分析和反恐维稳等提供关键技术支撑。
person name discrimination;user relationship network construction;user community detection;user language style analysis ;user topic interest analysis
本项目面向网络信息安全领域舆情监测和线索发现的实际需求,针对论坛、博客、微博等互联网交互平台中的网络用户(也称人物)在虚拟社会的交互行为和发言讨论进行分析挖掘,在人物搜索和同名人物消歧、用户关系网络构建和存储、用户群体发现、用户重要度计算、用户语言风格分析和用户兴趣话题分析等方面进行了深入研究,取得了一系列研究成果,为虚拟社会重要用户的识别和追踪提供了有效方法。项目按计划完成了任务书规定的各项研究内容,执行期间研究内容未做调整和变动。4年共计发表学术论文18篇,博士学位论文1篇,硕士学位论文9篇,申请专利13项,培养博士和硕士毕业生11名,超额完成了任务书规定的目标要求。项目负责人获得2012年度国家科技进步二等奖和2015年度北京市科学技术奖。该项目的研究成果已经在中科天玑关联分析系统和天玑学术网中进行转化应用,得到了公安、安全、国防等多个用户的肯定和好评。