位置:立项数据库 > 立项详情页
基于群学习的移动垃圾语音过滤模型研究
  • 项目名称:基于群学习的移动垃圾语音过滤模型研究
  • 项目类别:青年科学基金项目
  • 批准号:61001070
  • 申请代码:F010103
  • 项目来源:国家自然科学基金
  • 研究期限:2011-01-01-2013-12-31
  • 项目负责人:王非
  • 负责人职称:副教授
  • 依托单位:华中科技大学
  • 批准年度:2010
中文摘要:

移动通信技术的发展促进了个人通信的普及,但也造成了移动垃圾语音的泛滥,具有反动性质的移动垃圾语音甚至威胁到国家安全和社会稳定。然而,移动垃圾语音的形式与内容层出不穷、行为变化多端,因此现有的协议分析、信誉模型、呼叫模型与通信模式等研究成果已经难以胜任,这就使移动垃圾语音的过滤成为一个极具挑战性的问题。基于群学习的多标准信誉模型是解决移动垃圾语音问题的一个非常有希望的技术,但对此技术的研究,特别是身份的唯一性、多维特征模型、多标准信誉评估等方面还不成熟,需要在理论和算法方面进行深入的研究。本项目将以前期研究为起点,首先研究多宿主身份唯一性识别,保证用户身份全局唯一、不可伪造;然后研究移动垃圾语音多维特征模型,揭示其未知特征及特征变化规律;再研究以群为单位的分工协同学习模型,加速移动垃圾语音多维特征的学习过程;最后研究具有高准确性、高稳定性和低复杂度的个性化信誉评估模型。

结论摘要:

移动通信技术的发展促进了个人通信的普及,但也造成了移动垃圾语音的泛滥,具有反动性质的移动垃圾语音甚至威胁到国家安全和社会稳定。然而,移动垃圾语音的形式与内容层出不穷、行为变化多端,因此现有的协议分析、信誉模型、呼叫模型与通信模式等研究成果已经难以胜任,这就使移动垃圾语音的过滤成为一个极具挑战性的问题。本项目以此为目标,提出基于群学习的多标准信誉模型,对其中的关键技术展开了深入研究。第一,由于通信网络逐渐IP化、开放化,使得垃圾语音制造者有可能伪造多个身份,获取最大利益。针对这个问题,本项目提出基于声纹特征的多宿主身份唯一性识别机制,而其中对垃圾语音制造者的声纹特征的快速识别成为重中之重。本项目先后提出了基于码书过滤的快速说话人识别、基于Map-Reduce的大规模人群说话人识别以及基于PA-AESA算法的快速说话人识别三种算法,实验结果显示可以为垃圾语音制造者唯一性身份的识别提供有力保障。第二,通过问卷调查发现,在基于信誉的垃圾语音识别过程中,存在评价标准不统一。按照传统的信誉评估模型,将导致评估结果严重失真。针对这个问题,本项目重点研究了多标准的信誉评估模型,包括标准的划分、评估场景界定、信誉推荐的处理等方面。根据评估者的评估行为,确定其信任倾向,从而根据信任倾向搜索信任推荐,实现个性化、多标准的信誉评估。第三,考虑到信誉评估中存在规模庞大的信任推荐合并操作,计算量巨大,并且在个性化信誉评估中需要根据信任倾向搜索信任推荐,本项目进一步研究了以群为单位的分工协同信誉学习模型。该模型以小世界理论为基础,利用交互度频繁度、信任倾向等进行群组划分,并将用户的交互行为抽象为呼叫流,采用流数据处理技术实现动态实时群组更新。既降低了信任推荐的合并计算量,又提高了信誉评估的准确度。第四,为了协助被叫用户对主叫用户的评价,本项目通过对用户的呼叫行为特征进行分析,提供直接判断的支撑。现有研究多以一维或低维特征识别垃圾语音,效果有待改善。本项目提出了基于交互行为的高维行为特征模型,使垃圾语音制造者更难逃避识别。通过设计基于滑动窗口的聚类算法,实现了具有时效性的用户呼叫行为特征提取。最后,为了相关特征的动态更新,本项目采用流数据处理思想,研发了一个流数据处理平台。并在此基础上进一步研究了面向不确定数据的布鲁姆过滤器,为后续研究基于布鲁姆过滤器说话人识别建立基础。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 4
  • 5
  • 5
  • 0
  • 0
相关项目
王非的项目