目前,随着计算机和网络技术的不断发展, 以计算机为中介的通信(CMC)改变和改善了人们的日常生活,但同时也为欺骗和诈骗带来了新的场所和新的形式。如何从大量电子文本中自动地检测欺骗行为,关系到人民生活的安全、企业的存亡和国家的稳定。因此,对基于中文文本的欺骗行为自动检测的研究具有重大的现实意义。对CMC欺骗检测的实践研究在本世纪以来才开始展开,整体上处于刚刚起步的初级阶段。而专门针对中文文本CMC欺骗检测的研究在国内外还尚未开始。因此,本课题的研究必将推动国内外的同类研究。本课题研究内容有研究中文文本欺骗性数据集的建立方法和理论;如何利用自然语言处理技术自动获取暗示欺骗行为的语言学线索、消息内容线索和前后脉络关系线索;研究适合于中文文本的CMC欺骗检测的分类模型和机器学习算法,构建检测欺骗行为的模型,开发欺骗行为自动探测软件,实现中文文本中欺骗行为的自动检测。
英文主题词Computer-mediated communication;Deception detection;Content safety;Natural language processing