针对目前网络信息内容安全监控系统对于网上发布或传播的有害信息内容,涉及来源、相关人员、组织结构等网络关联因素的综合监测分析方法相对缺乏的问题,研究基于网络文本内容安全及其关联因素的智能关联分析方法。采用中英文文本分析技术,社会网络分析(SNA)、人工智能与自然语言处理中快速处理等技术,对基于宽带互联网络的各种文本信息进行信息采集与转化、安全关联特征抽取、安全关联内容及其相关群组的关系表达、动态监测
本项目《网络文本内容安全智能关联分析与监测方法研究》,是由北京理工大学管理与经济学院与中科院高能物理所合作的信息与管理交叉学科课题。围绕网络信息"内容"安全管理这一现代安全新课题展开的。重在对互联网上的各种文本内容信息反映的安全问题,进行关联性分析,探讨相关的组织、人员与相关主题内容之间的关联模型与监测方法。项目组提出了创新性的关联分析整体系统框架与监测模型,基于CCDGP体系结构的高速网络数据获取和还原算法,大规模中文文本分析核心算法- - 双字节编码算法,和带有简单语义的快速检测算法,建立了基于本体的关联表示模型和社会网络监测分析模型,并对百度BBS和美国安然事件的Email公开数据等进行了实证分析。其中的文本分析核心算法取得了突破性进展,在效率方面达到甚至超过了国际前沿的经典算法的几十倍,在国际重要刊物上发表了文章。项目成果已在国家级安全部门得到应用。并可以进一步支持Semantic Web的内容安全研究,和基于本体和语用方向的各种智能推理研究,可进一步建立国家级知识库和国际反恐监测研究。对于信息内容安全的方法和工具可以提供各种场合的应用,成为国家信息安全保障体系的一个重要组成部分。