位置:成果数据库 > 期刊 > 期刊详情页
一种改进的LDA主题模型
  • ISSN号:1673-0291
  • 期刊名称:《北京交通大学学报:自然科学版》
  • 时间:0
  • 分类:TP391.43[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北京交通大学计算机与信息技术学院,北京100044, [2]中国中医科学院广安门医院,北京100053, [3]中国中医科学院中医药信息研究所,北京100700
  • 相关基金:国家“973”计划项目资助(2006CB504601); 国家科技支撑计划项目资助(2007BA110B06-01); 国家自然科学基金资助项目(90709006); 北京市科委科研攻关项目资助(D08050703020804); 北京交通大学科技基金资助(2007RC072)
中文摘要:

由于文档中的词符合幂律分布,使得LDA模型的主题分布向高频词倾斜,导致能够代表主题的多数词被少量的高频词淹没使得主题表达能力降低.通过一种高斯函数对特征词加权,改进LDA主题模型的主题分布.实验显示加权LDA模型获得的主题间的相关性以及复杂度(Perplexity)值都降低,说明改进模型在主题表达和预测性能方面都有所提高.

英文摘要:

The distribution of words in the document satisfy power rules,which cause the topics incline the high frequency words,and then many words which can represent topics are submerged.It leads to reduce the expression capability of LDA topics.An improved LDA topic model is showed by weighting the feature words using Gauss function.The experiments indicate that the weighting topic model is better generalization performance by validating the correlations among the topics and the perplexity value of model.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《北京交通大学学报:自然科学版》
  • 北大核心期刊(2011版)
  • 主管单位:教育部
  • 主办单位:北京交通大学
  • 主编:孙守光
  • 地址:北京市西直门外上园村3号北方交通大学8楼8101室
  • 邮编:100044
  • 邮箱:bfxb@bjtu.edu.cn
  • 电话:010-51688053
  • 国际标准刊号:ISSN:1673-0291
  • 国内统一刊号:ISSN:11-5258/U
  • 邮发代号:
  • 获奖情况:
  • 1995年铁道部科技期刊一等奖、1999年教育部组织的...
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:5152