面临国内对金融衍生物以及结构化投资产品日益增高的要求,寻找一套具有自适应学习能力的金融时间序列预测分析模型是理论界和实务界的燃眉之急。本项目研究旨在构建一个基于自组织聚类算法的半参数模型,使其能够第一适合金融数据本身经济学特征同时不拘泥于模型结构限制;第二对于噪音信号具有较好的鲁棒性;第三能同时处理定量数据和定性数据并具有经济可行的计算效率;第四具有和其他经验模型的合作兼容性。模型构建将立足于发挥聚类算法对金融时间序列波动性聚类这一特点的适应性,使用局部模型来优化对分段平稳数据的预测分析,同时利用数据预处理、引入反馈环节、改变聚类中相似度的判别方法等手段来弥补聚类方法在处理数据间时序信息能力的不足。本项目将以具有典型金融时间序列特征并最易得的汇率数据为研究对象,而研究结果将可以广泛的应用于其他金融时序数据。
clustering;self-organizing map;information fusion;panel data;
本研究课题以自组织神经网络为主的聚类模型为主要研究对象,提取自组织网络的算法思想,尤其是邻域函数思想,辅以计量方法和假设检验的方法,将前期基于自组织神经网络的局部模型半参数算法根据不同的数据结构和特征,进一步的进行改良,以期提高模型的灵活性。在研究中,我们借鉴了很多较为成熟的算法思想,如遗传算法、混合高斯函数、模拟退火算法,同时引入具有较高适应能力的效用函数,来提高模型的对于特定数据的适应能力。本研究的主要特点之一就是人工智能算法(自组织神经网络、遗传算法)和传统计量算法的结合,具体来说既是将工程数据的相关性检验和金融市场数据的因果检验结合、将工程算法上的收敛性检验和金融市场数据算法中的显著性检验结合,籍此来部分克服人工智能算法由于“移植”所带来的“盲目性”。研究提出的此种模型算法的融合从技术理论上并没有很高的难度,主要是数据对于模型的适应,就从目前的研究成果来看,基本上可以看到一个令人较为满意的结果。 本研究的成果目前主要以理论研究为主,到2014年底,主持人作为第一作者发表了3篇一级及以上的论文,2篇核心期刊论文和2篇工作论文,研究团队完成了8篇一级以上的论文。论文主要集中在模型构建机制的讨论以及模型在不同性质的数据上的应用。未发表的工作论文主要集中在自组织神经网络和混合高斯模型上,即如何将混合高斯模型的学习过程使用自组织神经网络的思想进行优化。将传统的EM算法,转换成一个具有自适应能力的(通过模拟退火的方式来反映)算法。在应用对象上,不仅局限于一维时间序列数据,而是将着力研究该自适应算法对于面板数据的应用前景。面板数据具有时间序列的特性,同时也具有其高维度、相关度不稳定等特性。是否能将目前的模型推广到对面板数据的聚类处理,尤其是对于偏宏观的经济数据的聚类处理,是检验模型生命力的一个重要指标,也是我们研究努力的方向。