东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

应用hLDA进行多文档主题建模关键因素研究

ISSN号：1003-0077
期刊名称：中文信息学报
时间：2013.11.30
页码：117-127
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]北京邮电大学计算机学院智能科学技术中心,北京100876
相关基金：国家自然科学基金资助项目（71231002,61202247）;北京邮电大学青年科研创新计划专项;北京市科学技术情报研究所项目“科技情报辅助系统”;中央高校基本科研业务费专项资金（2013RC0304）;教育部信息网络工程研究中心.
相关项目：基于hLDA层次主题模型的中文多文档摘要研究

作者：衡伟，于佳，李蕾, 刘咏彬|

关键词：层次潜在狄利克雷分配, 层次主题建模, 统一分析框架, Hierarchical LDA Hierarchical Topic Modeling, Unified Analytical Framework

中文摘要：

hLDA（层次潜在狄利克雷分配）在层次主题建模中的良好效果已经得到广泛验证.为了实现半监督或无监督,通常采用交叉验证或抽样超参来确定参数.但由于语料特征、建模需求等不确定因素,参数调节方法、建模效果和数率都是实际应用中的难点.该文首先结合贝叶斯线索和范围线索构成的统一分析框架,研究hLDA主题建模中的关键影响因素,然后给出一个切实有效的建模策略及流程,最终结合ACL MultiLing 2013多文档摘要语料进行实际建模效果评估.

英文摘要：

The results of hLDA （hierarchical Latent Dirichlet Allocation） in the hierarchical topic modeling have been widely validated. In order to achieve semi-supervised or unsupervised learning, cross-validation or sampling super parameters are usually used to determine the true parameters. However, corpus features, modeling demand and some other factors are uncertain. Hence, parameter adjustment, modeling effectiveness and efficiency are difficulty to achieve in practical applications. This paper builds a unified analytical framework by combining Bayesian theory and boundary information, analyzes the key factors in its topic modeling, then gives a series of practical and effective modeling strategies and processes, and finally evaluates the modeling results with multi-document summary corpus from ACL MultiLing 2013.

同期刊论文项目

基于hLDA层次主题模型的中文多文档摘要研究

期刊论文 6 会议论文 13

面向不确定性的Web2.0用户创作内容管理研究

期刊论文 38

同项目期刊论文

Recognizing Sentiment of Relations between Entities in Text

Predicting Stay Time of Mobile Users With Contextual Information

智能科学与技术专业本科生导师制的研究与实践

智能科学与技术专业本科生导师制及复合型人才培养

运用Floyd算法辨识羊群效应中的“头羊”(意见领袖)

网络口碑和价值共创对消费者购买意愿的影响

基于网络生活方式的个人用户云服务购买意愿研究

Social Media Research: A Review

客户购买记录可以预测客户评论行为吗？

云工作流技术在商业智能SaaS中的应用

从众效应下的网络舆论演化

企业文化、智力资本和企业绩效的关系——以高科技企业为例

突发性公共危机事件网络舆情态势演化内外源动力探究

融合多特征的符号网络连边符号预测

基于有向拓扑势的用户角色分析方法

基于转发传播过程的微博转发量预测

智慧城市背景下公众反馈大数据分析：概率主题建模的视角

基于微博的企业突发危机事件网络舆情的股价冲击效应

基于微博的企业网络舆情热度趋势分析

基于微博的企业网络舆情社会影响力评价研究

基于Web2．0的企业危机事件网络舆情态势研究

突发性公共危机事件中政府沟通信息风险建模——基于微博的分析

基于内源动力话题的在线群体形成机理研究

基于外源动力话题的在线群体形成机理研究

云存储背景下影响在线好友邀请项目成功的因素研究

在线评论中离散情感的分布研究

生活消费平台虚假评论识别模型的研究

突发性公共危机事件网络舆情耦合机制研究

在线社交网络结构对信息传播的影响研究——以北京邮电大学某实验室为例

识别文本中实体的情感关系

LBLP：Link-Clustering-Based Approach for Overlapping Community Detection

社交媒体时代“意见领袖”再思考

BPGM： A Big Graph Mining Tool

基于微博平台的在线评论有用性研究——产品设计角度

社会化客户网络演化动机及危机处理机制

并行离群点检测在异常电话检测中的应用

社交网络结构对群体观点极化的影响研究

Social network users clustering based on multivariate time series of emotional behavior

TTRank：基于倾向性转变的用户影响力排序

Autonomic discovery of subgoals in hierarchical reinforcement learning

期刊信息

《中文信息学报》
北大核心期刊（2011版）

主管单位:中国科学技术协会
主办单位:中国中文信息学会中国科学院软件研究所
主编：孙茂松
地址：北京海淀中关村南四街4号中科院软件所
邮编：100190
邮箱：jcip@iscas.ac.cn
电话：010-62562916

国际标准刊号：ISSN：1003-0077
国内统一刊号：ISSN：11-2325/N
邮发代号:

获奖情况:

国内外数据库收录:
日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:9136