社会网络分析是理解人类行为、分析社会结构的重要工具。然而,传统社会网络构建方法在信息获取的效率、信息规模、信息质量方面已经无法满足日益增长的大规模社会网络分析需求。为此,本项目将针对Web环境下的大规模非规范异构数据源,探索提取具有高可信度、高质量的社会网络数据关键理论;并在此基础上,以提高社会网络数据提取的质量和性能为基本出发点,研究并探讨面向多Web数据源的社会网络实体识别及噪音处理方法、时变及有权社会网络数据提取方法、高效的海量社会关系提取及多关系整合方法,研究并行计算框架对于社会网络提取的支撑技术;并将针对典型的Web数据源实现高效的社会网络数据提取原型系统。项目的实施将为满足日益增长的来自科学研究和应用领域对于高质量社会网络数据的需求,提高广泛应用于国家安全、国民经济以及信息服务等领域的社会网络分析的质量提供理论依据和技术方案。
Social networks; Entity extraction;Relationship extraction;Web data processing;Social network analysis
针对Web环境下的大规模非规范异构数据源,开展了面向大规模Web数据源的高可信度、高质量的社会网络数据提取关键理论;在此基础上,以提高社会网络数据提取的质量和性能为基本出发点,提出了面向多Web数据源的社会网络实体识别及噪音处理方法,实现基于事务日志的社会网络抽取方法,高效的海量社会关系提取及多关系整合方法,并行计算框架对于社会网络数据提取的支撑技术;并针对典型的Web数据源实现了高效的社会网络数据提取原型系统,以此来满足日益增长的来自科学研究和应用领域对于高可信度、高质量的社会网络数据的需求,提高广泛应用于国家安全、国民经济以及信息服务等领域的社会网络分析的质量。