随着采集和存储技术的发展,高维观测数据、高维特征矢量不断涌现,在提供更多信息的同时也不可避免地对处理工具和方法提出了严峻的挑战。因子混合分析器是近期提出的在完成数据处理任务的同时实现数据降维的典型工具,然而现有的基于最大似然准则的因子混合分析器无论在模型结构还是参数上都存在着局限性。为此,本项目首先将在非参数贝叶斯框架下对因子混合分析器进行理论研究,主要包括模型的建立和与模型相关的学习算法的推导。在理论研究完成后,拟将得到的非参数贝叶斯因子混合分析器嵌入隐马尔可夫模型中,并将其应用于当前语音信号处理中的热点问题- - 说话人分割聚类。本项目的理论研究提出的非参数贝叶斯因子混合分析器可望根据数据自动确定合适的模型结构和参数分布,从而更精确更灵活地处理高维数据;其应用研究成果有助于进一步提高说话人分割聚类系统的性能,并且为解决信息科学中其它相关的应用问题提供了新的思路和方法。
英文主题词factor mixture analyzer;nonparametric Bayesian;distributed estimation;speaker diarization;