针对数据质量的需求日益迫切,基于距离的数据约束规则在数据冲突检测、数据一致性分析、数据修复等数据质量应用中具有重要作用。本项目拟研究距离约束规则的自动挖掘机制,并探讨距离约束规则在数据修复中的实践方法。其中针对距离约束规则的挖掘问题,提出无参数的距离阈值确定方法,并设计距离阈值计算算法的性能优化技术。通过研究距离约束规则的挖掘方法,能够为数据质量领域的应用提供理论依据和技术基础。其中,本项目重点研究距离约束规则在数据修复中的实际应用。通过理论分析,探讨基于距离约束规则的数据修复问题复杂度和技术难点,并提出基于安全收缩的有效近似修复方法。研究结果将通过实验进行验证。距离约束规则的自动挖掘和数据修复技术将提高数据的质量和可信度,促进我国可信软件的部署与发展。
英文主题词Data Constraints;Metric Distance Constraints;Data Dependencies;Data Repairing;Data Quality