位置:成果数据库 > 期刊 > 期刊详情页
一种基于非参数贝叶斯模型的聚类算法
  • ISSN号:1001-5132
  • 期刊名称:宁波大学学报(理工版)
  • 时间:2013.10
  • 页码:24-28
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]宁波大学信息科学与工程学院,浙江宁波315211
  • 相关基金:国家自然科学基金(61175026);浙江省新一代移动互联网用户端软件科技创新团队项目(2010R50009);宁波市自然科学基金(2011A610193);宁波大学学科项目(XKL09154)
  • 相关项目:基于表观特征的目标人体识别研究
作者: 张媛媛|
中文摘要:

鉴于聚类分析是机器学习和数据挖掘领域的一项重要技术,并且与监督学习不同的是聚类分析中没有类别或标签的指导信息,所以如何选择合适的聚类个数(即模型选择)一直是聚类分析中的难点.由此提出了一种基于Dirichlet过程混合模型的聚类算法,并用collapsed Gibbs采样算法对混合模型的参数进行估计.新算法基于非参数贝叶斯模型的框架,能够在不断的采样过程中优化模型参数并形成合适的聚类个数.在人工合成数据集和真实数据集上的聚类实验结果表明:基于Dirichlet过程混合模型的聚类算法不但能够自动确定聚类个数,而且具有较强灵活性和鲁棒性.

英文摘要:

Clustering is one of the most useful techniques in machine learning and data mining.In cluster analysis,model selection concerning how to determine the number of clusters is an important issue.Unlike supervised learning,there are no class labels and criteria to guide the search,so the model for clustering is always difficult to select.To tackle this problem,we present the concept of nonparametric clustering approach based on Dirichlet process mixture model(DPMM),and apply a collapsed Gibbs sampling technique to sample the posterior distribution.The proposed clustering algorithm follows the Bayesian nonparametric framework and can optimize the number of components and the parameters of the model.The experimental result of clustering shows that this Bayes model has promising properties and robust performance.

同期刊论文项目
期刊论文 22 会议论文 3
同项目期刊论文
期刊信息
  • 《宁波大学学报:理工版》
  • 主管单位:宁波大学
  • 主办单位:宁波大学
  • 主编:方志梅
  • 地址:浙江宁波江北区风华路818号
  • 邮编:315211
  • 邮箱:
  • 电话:0574-87600816
  • 国际标准刊号:ISSN:1001-5132
  • 国内统一刊号:ISSN:33-1134/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 美国化学文摘(网络版),英国动物学记录
  • 被引量:4395