课题针对Web信息处理面临的三大挑战性问题,即Web信息特征表达的多维度问题、Web内容计算的不确定性问题和Web数据演化性问题出发,开展面向Web搜索与挖掘相关的新理论和新方法研究。在基础理论方面,展开基于维度挖掘的Web信息多维计算理论、Web信息内容处理的不确定计算理论和Web数据聚集计算理论的研究;基于基础理论的发现,在关键技术方面开展基于用户知识空间的个性化搜索、网络文本倾向性分析、网络话题的发现与跟踪、社区发现与关系挖掘以及网络舆情宏观态势分析等技术的研究;基于基础理论和关键技术的突破,研制舆情安全分析与预警原型系统,并基于海量真实数据和实际运行环境,对基础理论和关键技术进行验证。课题将提出Web信息计算新型理论,设计更加高效的Web搜索与挖掘新方法。同时为基于大规模Web信息挖掘的战略应用- - -网络舆情分析和预警的研究奠定理论基础和关键技术支撑。
Public Opinion Analysis;Data Mining;Topic Detection;Sentiment Analysis;Personalized Search
本项目针对Web信息处理的多维度、不确定性、演化性等挑战性科学问题,在理论方面重点研究了网络内容计算的不确定性理论、多维度的话题模型理论和复杂网络模型理论。在关键技术层面解决了国家舆情分析面临的Web搜索和挖掘的关键问题,具体在社交网络的个性化搜索、网络话题发现与演化分析、社区发现与演化分析、网络舆情态势分析等多项关键技术方面取得突破。基于上述在基础理论与关键技术上的突破,开发了两大产品和系统,并在国家舆情分析领域中得到应用验证。在项目研发过程中,项目还培养研究生80余名,在国内外学术会议及刊物上发表论文近200篇,超计划完成了相关的任务。