类别不平衡的客户价值区分是客户关系管理(CRM)中经常面临的难题。区别于仅仅使用"系统内"数据的客户价值区分传统研究范式,本项目提出将"系统内"和"系统外"数据进行有效整合的新研究范式,并给出了类别不平衡环境下的客户价值区分迁移集成的概念及研究框架。在该框架下,研究了类别不平衡环境下客户价值区分迁移学习机制,提出多准则客观系统聚类和基于GMDH的迁移特征选择来对客户数据进行预处理,构建基于GMDH的迁移集成策略对基本分类器进行集成。最后,针对不同客户价值区分问题,给出最适合的迁移集成解决方案并做实证研究。研究成果将提升CRM运用的科学性,发展迁移集成策略,为现代企业管理理论及迁移学习技术奠定重要理论基础,对其它领域中的类别不平衡问题研究也具有重要的借鉴意义。
customer value differentiation;class imbalance;GMDH;transfer learning;ensemble learning
客户价值区分是客户关系管理(CRM)中重要问题之一。为解决用于客户价值区分建模的数据类别分布高度不平衡问题,区别于仅仅使用“系统内”数据的客户价值区分传统研究范式,本项目首先提出将“系统内”和“系统外”数据进行有效整合的新研究范式,并给出了类别不平衡环境下的客户价值区分迁移集成的概念及研究框架。在该框架下,研究了类别不平衡环境下客户价值区分迁移学习机制,提出基于GMDH的迁移特征选择来对客户数据进行预处理,构建了基于GMDH的迁移集成策略对基本分类器进行集成,取得了很好的性能。进一步地,本项目将研究范围扩展到用于客户价值区分的数据包含缺失的情形,构建了面向缺失数据的“一步式”集成模型。最后,针对不同的客户价值区分问题(如客户信用评估、客户流失预测以及目标客户选择等)的数据特征,给出最适合的解决方案并做实证研究,取得了很好的客户价值区分效果。此外,我们还将集成学习技术用于经济预测中,构建了相应的集成预测模型,这些模型都能取得比已有模型更好的经济预测性能。所研究成果将提升CRM 运用的科学性,发展迁移集成策略和多分类器集成策略,为现代企业管理理论、迁移学习技术和集成学习技术奠定重要理论基础,对其它领域中的类别不平衡问题研究也具有重要的借鉴意义。围绕着本项目的开展,协助培养了3位博士研究生、5位硕士研究生;已发表和录用的论文35篇,其中SCI、SSCI期刊论文10篇,国家自然科学基金委管理学部认定的A级期刊8篇;出版学术专著1部;获得四川省科技进步二等奖和四川省十六次哲学社会科学优秀奖三等奖各1项。