位置:成果数据库 > 期刊 > 期刊详情页
基于聚类分析的中文客户地址自动分组方法
  • ISSN号:1000-1220
  • 期刊名称:《小型微型计算机系统》
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]湖南科技大学知识处理与网络化制造湖南省普通高校重点实验室,湖南湘潭411201, [2]中南大学信息科学与工程学院,长沙410083
  • 相关基金:国家自然科学基金项目(61272063,61073104,61073186)资助;教育部新世纪人才项目(NCET一104)140)资助;湖南省杰出青年基金项目(11JJ1011)资助;湖南省科技计划项目(2011GK3157,2011FJ3133)资助;湖南省教育厅项目(09K085,12C0119)资助.
中文摘要:

提出一种基于聚类分析的中文客户地址自动分组方法.该方法考虑了客户地址的噪声数据,首先利用标准中国邮政编码数据中的邮政编码、省份与城市等信息来判断客户地址的有效性,然后通过字符串匹配反馈学习的方法对有效客户地址进行中文分词,将分词结果利用向量空间模型进行表示后再基于改进的混合K均值微粒群聚类方法将地址聚类,通过结合模拟退火算法来避免搜索陷入局部极小,最终根据最优微粒确定的聚类中心产生地址分组.采用真实地址数据进行对比实验的结果验证了该方法的有效性.

英文摘要:

This paper proposes a method of automatic grouping Chinese customer addresses by clustering analysis. This method mainly consists of two algorithms: one is an algorithm of validating and segmenting the Chinese customer addresses, which employs the province and city information of standard Chinese postal code dataset and a character string matching based feedback method to a- chieve it; and the other is an improved hybrid clustering algorithm of K-means and particle swarm optimization, which integrates the simulated annealing algorithm to improve the local explorative ability of particles. It can help to solve the address-related problems in applications such as the optimization of physical distribution. The comparative experiments based on several real address sets show its effectiveness.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《小型微型计算机系统》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院沈阳计算技术研究所
  • 主编:林浒
  • 地址:沈阳市浑南新区南屏东路16号
  • 邮编:110168
  • 邮箱:xwjxt@sict.ac.cn
  • 电话:024-24696120 024-24696190-8870
  • 国际标准刊号:ISSN:1000-1220
  • 国内统一刊号:ISSN:21-1106/TP
  • 邮发代号:8-108
  • 获奖情况:
  • 中国自然科学核心期刊,中国科学引文数据库来源期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23212