传统的数据模型,如统计模型,大都是基于逼近论的想法的。最简单的例子就是线性回归模型。这种想法对研究数据集的局部性态比较有效,但难以反映数据集的整体性态。要有效地研究数据集的整体性态,就必须采用拓扑或几何的方法。本项目的重点是系统地研究大型复杂数据集的拓扑和几何模型,以及相关算法。我们将通过举办小型研讨会,讲习班等形式,对数据的拓扑和几何模型作全面和深刻的考察,尤其是对由数据产生出的复杂网络的拓扑结构作深入的研究。通过这些研讨会,我们将把学术界和企业界的相关人员联合起来,共同商讨这些问题。驱动这项研究的具体问题之一是新浪微博网络以及Twitter网络的拓扑结构。这项研究的受益面不仅仅是在数学界,它将会对信息产业产生一定的影响。
英文主题词Topological & Geometric Data Analysis;Morse Theory;Hodge Theory;Computer Science;Computational Biology