基于模糊认知图对非常规突发事件Web信息进行语义表示,建立模糊认知图间的关联关系;继而增量构造复杂关联语义链网络,为非常规突发事件信息传播与演化机理的定量分析提供"情景"语义载体。基于不同时刻"情景"载体的差异性可形成连带事件复杂网络来检测非常规突发事件,进而建立非常规突发事件信息快速获取方法。研究"情景"载体的统计特征及其与语义特征的关联函数,为事件传播与演化机理定量分析提供可计算单元。以统计特征与关联函数为纽带,研究非常规突发事件传播的深度、广度、速度、推动力与阻力等传播机理,以及信息的阻断、消除和扩散机理;继而对信息传播机理进行集成建模。研究非常规突发事件传播特征的演化和事件不同层次情景单元的演化机理;继而对非常规突发事件不同演化阶段的演化机理进行分析;最后对非常规突发事件演化机理进行集成建模。以期本研究能为非常规突发事件信息传播与演化机理的定量分析提供一种有效工具。
semantic link network;resource space model;information spreading;information evolution;emergent web event
针对大规模网页资源中的网络热点与突发事件,提出文本内关键词之间,话题内关键词之间,以及领域内关键词之间的关联关系挖掘算法,继而构造关键词层、Web资源层与话题层多粒度复杂关联语义链网络,以对非常规突发事件的Web信息进行语义表示与组织,并提供“情景”语义载体。根据链接权重对关联语义链接进行筛选,继而对Web资源层关联语义链接进行统计特征分析,以发现统计特征变化的规律。然后,通过建立Web事件发展的不同状态与关联语义链接的平均路径、聚类系数以及平均度之间的对应关系,即可建立起从语义特征到统计特征的通路,为网络热点与突发事件的传播与演化机理研究提供基础。通过对关键词关联语义链网络中节点的熵进行分析,从而识别出不同关键词在语义不确定性上的层次性,继而构建事件的语义金字塔模型。基于不同时刻“情景”载体的差异性,可形成事件复杂网络来检测非常规突发事件,进而建立非常规突发事件信息快速获取方法。研究“情景”载体的统计特征及其与语义特征之间的关联函数,为事件传播与演化机理定量分析提供可计算单元。提出基于语义爆发度的Web事件生命过程度量算法。在此基础上,引入Web事件类型判别所涉若干特征因素,提出了基于贝叶斯的Web事件类型判别概率模型。提出了Web事件演化状态检测算法,以发现Web事件演化过程中的不同状态;继而对Web热点与突发事件不同阶段的演化机理进行分析。基于Web事件网络结构特征参数,以及观察变量与事件演化趋势之间的因果关系,比如事件各周期状态的物理特征参数与事件演化状态之间存在着紧密的因果关系,提出基于隐马尔可夫模型(HMM)的Web事件即时预测方法。 上述研究能为非常规突发事件信息在Web中的传播与演化机理的定量分析提供一种有效工具。本项目在重要国际学术刊物,包括IEEE Trans. on NN,IEEE Trans. on ASE,World Wide Web Journal,IEEE Internet Computing等国际期刊发表论文11篇;另外,还有一项研究成果已经被IEEE Trans. on HMS 的associate editor录用;在国际会议上发表论文9篇;方法研究成果申报了2项技术发明专利,其余成果正在申报技术发明专利;该项目培养硕士研究生6名,博士研究生7名。获得2011年度上海市自然科学奖三等奖。