在非常规突发事件的进程中,网络上会有大量相关的图像、视频等可视数据不断出现、繁衍与传播,在线地监测论坛、博客、视频社区等不断发布的网络可视数据流,实时发现并跟踪网络上新兴的主题并对其内容进行分析处理可以为政府相关部门在应急处理过程中的分析与决策提供强有力的信息支撑。本课题针对非常规突发事件中的网络可视数据的实时主题挖掘方法展开研究,主要研究内容包括网络可视数据流的实时特征提取技术和可视数据流上的实时主题挖掘方法研究,并在以上关键技术与核心算法研究的基础上,结合重大研究计划的目标,搭建网络可视数据流的在线监测原型系统,提供针对非常规突发事件的网络数据流的内容真实性与权威性的判断及虚假信息预警等功能。本课题预期在数据流挖掘的理论上有所突破,在网络数据处理的技术方法上有所创新,为面向非常规突发事件的网络信息处理理论和实际应用奠定基础。
Internet visual data;topic mining;data stream;emergency management;
在非常规突发事件的进程中,在线地对论坛、博客、视频社区等不断发布的网络数据流进行分析与挖掘,实时发现并跟踪网络上新兴的主题并对其内容进行分析处理可以为应急处理过程中的分析与决策提供强有力的信息支撑。本课题针对非常规突发事件中的网络数据流的实时挖掘方法展开研究,并在此基础上,搭建网络数据流的在线监测原型系统。课题具体研究成果包括针对网络数据流的突发性和动态性,提出了异步文本流的主题挖掘方法、多领域主动学习方法和知识迁移方法;针对数据的不确定性,对维度不完整数据这一广泛存在的数据形式进行了研究,提出了针对该数据的相似查询方法;结合当前网络应用中广泛存在的短文本数据,考查了稀疏性对文本分析与挖掘所带来的挑战,提出了短文本数据的多粒度表示方法与分类方法。结合原型系统的搭建,对可视数据这种典型的非结构化数据的处理方法进行了分析与设计,提出了针对该类数据的改进的语义标注和个性化推荐方法。课题研究成果一方面丰富了网络数据流挖掘的理论与技术,另一方面也为非常规突发事件的应急管理提供了网络信息处理技术支撑。