Web社区拥有越来越庞大的用户群体,迫切需要发现社区中用户的真实个性,发现重要用户并对其排序,以圈定目标客户,推送精准广告和信息,提升品牌口碑。然而,由于社区中用户的虚拟性,发现隐蔽的真实身份和个性十分困难,现有研究还跟不上Web社区的迅猛发展,尚无有效的解决方法。还主要采用传统的访问日志、话题高频词等技术发现用户兴趣;采用链接分析、点击率、发帖和跟贴数,对用户、话题和社区排序,忽略了话题的主题相关性和用户质量,使得对社区的个性挖掘和排序结果不够准确。因此,本项目建立Web社区用户个性模型;研究基于用户访问时间统计、个性要素识别规则、话题高频词和高频交流用户的多侧面社区用户个性挖掘;结合用户个性挖掘、链接分析和话题质量的社区重要用户发现及多维度排序;结合用户排序和话题质量的Web社区话题排序;结合用户和话题数量及质量的社区排序方法;为开发新一代社区搜索引擎提供理论和技术基础。
Web Community;Personality Mining;User Ranking;Community Ranking;Topic Ranking
Web社区拥有越来越庞大的用户群体,迫切需要发现Web社区中用户的真实身份和个性,发现重要用户并对其排序,以圈定精准客户,推送精准广告和信息,发现重要舆论领袖,扩大品牌口碑传播。然而,由于社区中用户的虚拟性,发现隐蔽的真实身份和个性十分困难,现有研究跟不上Web社区迅速发展,还主要采用传统的访问日志、话题高频词等技术发现用户兴趣;采用链接分析、点击率和发帖、跟贴数对用户、话题和社区排序。因此,本项目针对这些问题,提出了Web社区用户个性模型;并基于用户访问时间分析、用户个性各要素识别规则、用户话题高频词向量,设计了Web社区用户真实身份和个性挖掘算法;提出了结合用户个性挖掘和链接分析的Web社区重要用户的发现及多维度排序方法、结合用户排序的Web社区话题的排序方法;以及结合用户和话题质量的社区排序方法;最终实现了 “Web社区用户个性挖掘与排序”原型系统。探索出了一条解决基本科学问题“在虚拟Web社区中用户真实个性的挖掘及重要性排序”的新途径。