数据挖掘已成为后信息化时代获取知识的关键技术和商业智能的关键要素。本研究针对数据挖掘实践应用中存在的知识过载、忽视情境、专家领域知识等导致的挖掘出的规则不新颖、不可行动和难以用于决策支持等问题,从数据挖掘和知识管理交叉学科的角度,提出领域知识驱动的深层知识发现。本研究在建立领域知识驱动的深层知识发现理论模型框架的基础上,重点研究领域知识的提取、表示以及基于领域知识的深层次知识发现模型和关键技术,主要包括数据挖掘产生的衍生原始知识的测度、评价以及模式转化的模型算法和技术实现,并在此基础上构建领域知识驱动的深层知识发现过程模型和系统平台,进行应用和实证研究。该研究把数据挖掘获取的衍生原始知识明确地引入知识管理领域,作为一种特殊的知识进行研究,并充分考虑了领域知识等重要因素。该研究基于应用需求,对促进数据挖掘和知识管理学科的融合,推进数据挖掘的商业应用具有重要的理论和实践价值。
Domain knowledge;Data mining;Knowledge management;Second-order knowledge discove;Extenics
在大数据时代,数据挖掘已成为获取知识的关键技术和商业智能的关键要素。主要针对目前数据挖掘实践应用中存在的知识过载、忽视情境、专家领域知识等导致的挖掘出的规则不新颖、不可行动和难以用于决策支持等问题,综合利用知识管理、数据挖掘(关联规则、分类等)、综合集成、本体论、可拓学等交叉学科的理论进行研究,在国家自然科学基金的资助下,对领域知识驱动的深层知识发现进行了较为系统全面的研究。 研究成果主要有以下几个方面(1)在系统综述和分析已有国内外研究成果以及数据挖掘典型案例的基础上,把数据挖掘获取的衍生原始知识明确地引入知识管理领域,从深层知识发现过程、知识库与知识资产、深层知识管理关键要素三个层面提出了深层知识发现过程模型,并提出了六种智能知识管理系统集成方法,以及衍生原始知识到深层知识的五种转换模式。(2)从知识模型的角度分析了用本体表示领域知识的可行性,提出了一个改进的本体构建模型,设计了一个适用于知识发现的基于本体的领域知识表示和提取方法,并将其用于车险领域本体、超市商品领域本体等。(3)重点研究了基于领域知识的深层次知识发现算法、模型和关键技术,将领域知识加入数据处理、数据挖掘过程以及数据挖掘后结果的处理,基于效用测度、用户关注程度、意外度的领域知识驱动的关联规则深层知识发现算法等,包括基于意外度的关联规则挖掘、基于领域知识的个性化推荐算法、基于可拓学的可转化深层知识获取算法、基于领域知识和客户偏好的深层知识获取算法、基于情境的知识发现算法、基于粗糙集的多目标线性规划分类规则提取等。(4)在上述研究的基础上,本研究设计了基于情境的深层知识发现平台系统原型,该系统的特点是可以将情境等因素加入数据挖掘过程,并可实现挖掘知识的存储、推送等功能。(5)本研究还进行了案例和实证研究,包括银行、保险、零售业、汽车销售、电子商务数据等网络零售数据等,获得了好的应用效果。 该项目在课题组全体成员的努力下,圆满地完成了预定的研究计划,研究成果对促进数据挖掘和知识管理学科的融合,推进数据挖掘的商业应用具有重要的理论和实践价值。