位置:成果数据库 > 期刊 > 期刊详情页
基于文本挖掘和网络分析的“东突”活动主要特征研究
  • ISSN号:0254-4156
  • 期刊名称:《自动化学报》
  • 时间:0
  • 分类:TP[自动化与计算机技术]
  • 作者机构:[1]国防科学技术大学信息系统与管理学院,长沙410073, [2]中国科学院数学与系统科学研究院,北京100190, [3]中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190, [4]中国科学院云计算产业技术创新与育成中心,东莞523808, [5]北京师范大学系统科学学院,北京100875
  • 相关基金:国家自然科学基金(71103180,91124001)资助
中文摘要:

开源情报是反恐研究的一种新数据源,内容十分丰富且获取与分析技术日益成熟。目前,基于开源情报的反恐方面的研究成果已彰显出巨大应用前景。本文以“东突”分裂活动为研究对象,利用网络爬虫从万维网中获取相关文本数据,采用文本分析方法从这些数据中抽取“东突”分裂活动中涉及的人员、组织、时间和地点四要素,依据概念之间的关联关系构建多模元网络。首先采用元网络分解法将多模元网络分解成单顶点子网络和二分子网络,通过对各个子网络进行中心性分析判别各类节点的重要性;然后综合各个子网络的中心性指标形成人员、组织、时间和地点四类节点的重要性综合指数(Importance composite index, ICI)。随后,进一步采用k-壳分解法直接对多模元网络进行分解,判别出元网络中的核心节点。经对比分析,发现本文的研究结果与实际结果吻合较好。

英文摘要:

Open source intelligence, with rich content and sophisticated collection and analytical techniques, is an al-ternative data source in many anti-terrorism studies and has manifested significant applicable prospects. In this paper, we take the “East Turkistan” separatist activities as the research ob jects and collect the data from the world wide web by utilizing web crawlers. We adopt text analysis techniques to extract the information of four fundamental elements of “East Turkistan” separatist activities, including person, organization, time and place, and then construct multi-mode networks according to the relations between concepts. To analyze the characteristics of these networks, we first apply the approach of dimensional decomposition to separate the multimode networks into single vertex sub-networks and bipartite sub-networks, distinguish the importances of different types of nodes by measuring the centrality of each sub-network, and synthesize the centrality index of each sub-network to form an importance composite index (ICI). To further identify the core nodes of the four types of nodes in the network, we adopt the k-shell decomposition method to directly decompose the multi-mode network. We find that the results produced by these approaches presented above can be in accord with the actual ones.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《自动化学报》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国自动化学会 中国科学院自动化研究所
  • 主编:王飞跃
  • 地址:北京东黄城根北街16号
  • 邮编:100717
  • 邮箱:aas@ia.ac.cn
  • 电话:010-64019820
  • 国际标准刊号:ISSN:0254-4156
  • 国内统一刊号:ISSN:11-2109/TP
  • 邮发代号:2-180
  • 获奖情况:
  • 1997年获全国优秀期刊奖,1985、1990、1996、2000年获中国科学院优秀期刊二等奖,2002年获国家期刊奖
  • 国内外数据库收录:
  • 美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:27550