基于经验分布函数理论,研究了非均匀区间与分布式符号数据的描述统计,包括单变量描述统计和双变量描述统计。基于此,研究了非均匀区间与分布式符号数据的主成分分析方法,通过随机模拟,对符号数据的主成分分析方法进行了有效性评价。对于一般分布的区间型符号数据,考虑区间数内部的样本点信息,提出了一种新的距离,基于此,提出了非均匀区间型符号数据的系统聚类算法和模糊C均值聚类算法,并通过随机模拟,对所提出的方法进行了有效性评价。研究了符号数据的回归分析方法,提出基于误差传递公式的区间数回归分析方法和基于描述统计量的区间型符号数据回归分析方法,并通过随机模拟,对所提出的方法进行了有效性评价。将符号数据多元分析方法应用于我国的股票市场,进行案例分析,验证了这些方法的正确性,并从全局上研究我国股票市场的一些特性。
英文主题词symbolic data; principal component analysis; clustering; regression analysis