信息负表示是基于生物免疫系统中的"负检测"原理而建立的新型计算模型,是人工免疫系统中的一个重要研究分支,其具体的数据管理形式为负数据库,具有信息隐藏等优良特点,在信息安全领域具有广阔的应用前景。本项目旨在对信息负表示的理论基础和应用进行深入的研究。具体而言,本项目将重点研究完备、难解且大小适中的负数据库生成算法,负数据库操作的高效实现算法及其分析,基于负数据库(或负数据库和传统数据库的混合数据集)的数据统计分析方法,负数据库信息隐藏程度的评估方法,信息负表示的完备性和难解性评估理论等基础理论和关键技术。该项目的研究不仅有利于建立新型的可用于信息隐藏和隐私保护等领域的数据保护技术,而且有利于促进基于生物免疫原理的信息安全新机制的研究和发展。
Artificial Immune System;?Negative Representations of Information;Negative Database;Information Hiding;Privacy Protection
本项目围绕信息负表示的理论基础和应用展开了深入研究,主要工作包括给出了实值负数据库的一个定义和生成算法,证明了对实值负数据库求逆获取原数据是NP难的,并给出了一个基于实值负数据库的隐私保护数据发布示例;提出了用于生成单串负数据库的p-hidden算法,形式化地分析了p-hidden算法所生成的负数据库相对于局部搜索策略求解器的难解性,给出了相应的难解程度计算方法,以及与传统方法的理论和实验对比分析结果;首次将负数据库应用于安全多方计算领域,提出了负数据库的半同态性质,构建了基于负数据库的安全交集协议;提出了两种由负调查结果估算正调查结果的方法,使得所估算的正调查结果不会包含负值;将寻找最优负调查看作一个多目标优化问题,利用Steffensen迭代法对由负调查结果估算正调查结果的方法进行了改进,进而给出了一种快速搜索最优负调查的方法;推导出q-hidden负数据库上的海明距离与原始数据上的海明距离之间的对应关系,进而提出了q-hidden负数据库上的k最近邻分类算法和k均值聚类算法;对负调查的可信度进行了分析,并设计了一种用于计算最小置信域的贪心算法;提出了一种包含预定义多解的3-SAT难解实例生成算法,可用于针对多串DB生成大小适中且难解的NDB;将负表示思想引入到数据发布领域,将负表示与隐私保护数据发布领域的经典模型k-匿名和l-多样性相结合,提出了数据负发布方法,可提高现有方法的隐私保护度,并基于个体敏感值的分布提出了改进的数据负发布方法;提出了控制粒度更小的K-hidden算法,用于生成难解的负数据库,用理论和实验分析了K-hidden-NDB更难被基于局部搜索策略的SAT求解器求解;提出了“负虹膜识别”的概念,构建了一种新型的安全虹膜识别方法,展示了该方法能扩展支持一些虹膜识别的重要策略(如移位和掩码)以提升虹膜识别的性能,分析了负虹膜识别的安全性和效率,采用实验结果表明了负虹膜识别方法的识别效果。