东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于混合模型的文本聚类研究综述

ISSN号：1000-0135
期刊名称：《情报学报》
时间：0
分类：TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]南京大学信息管理学院,南京210023
相关基金：国家社会科学基金重大招标项目“面向学科领域的网络信息资源深度聚合与服务研究（12＆ZD221）”以及国家自然科学基金项目“融合范式视角下的链接分析理论集成框架及其实证研究（71273125）”的资助.

关键词：模型聚类, 混合模型, 文本聚类, model-based clustering, mixture model, document clustering

中文摘要：

相较于其他聚类算法，模型聚类的实证研究结果表现出了独特的优势，越来越受到学界的关注。本文梳理了混合模型文本聚类的相关研究，根据聚类分析的技术路线，主要综述了文本建模、参数建模以及模型推理等三个主要模块，在此基础上总结了特征降维、半监督聚类以及聚类过程的系统整合等不同研究中的共性问题。最后，提出了本领域未来可能的研究方向。

英文摘要：

Model-based clustering has attracted more and more attention, and empirical studies also showed distinct advantage. This paper reviews the status of the document clustering based on mixture models. According to the technical routes, it summarizes three main parts, such as document modeling, parameter modeling, and model inference, and analyses the common problems in different researches, including feature reduction, semi-supervised clustering and the integration of clustering process. At last it presents possible future research directions in this field.

同期刊论文项目

融合范式视角下的链接分析理论集成框架及其实证研究

期刊论文 6

　面向学科领域的网络信息资源深度聚合与服务研究

期刊论文 36

同项目期刊论文

独立性视角下医院信息系统持续使用意愿研究

基于网络计量的股权众筹平台融资能力分析

链接分析：知识基础、研究主体、研究热点与前沿综述——基于科学知识图谱的途径

面向投资者的P2P网贷平台选择——聚类分析方法的应用

基于“问题-用户”的网络问答社区专家发现方法研究

独立性视角下医院信息系统持续使用意愿研究

基于径向基函数的分数年龄假设

Evaluating journals＇ yearly impact with altmetric indicators

近十年国内外网络导航研究比较

技术接受模型的理论演化与研究发展

基于DEA方法的政务微博信息交流效率研究

高校学生用户学术数据库使用意向影响因素研究

少数民族数字文化资源建设及整合研究

基于LibGuides的国内高校图书馆图书情报学科导引建设研究

国外网络学科导航比较分析与经验启示

学术资源本体非等级关系抽取研究

基于图书借阅网络的各类书籍关系研究

高知识创造网络中合作关系分布探究

意义建构理论研究综述

基于关注视角的高校微博信息交流实证分析

基于UGC文本挖掘的游客目的地选择信息研究——以携程蜜月游记为例

国外虚拟社区环境下知识分享行为影响因素研究综述

基于词频分析的“驴友”旅游目的地选择研究

社交网络工具持续使用影响因素的实证研究

大学的学术矩阵和学术迹探讨

国际学术评价指标研究现状及发展综述

基于问题解决理论的导航过程认知特征研究

中文医学专业术语的层次结构生成研究

我国图书情报学科知识结构的建立及其演化分析

图书情报领域学术深网资源利用探究

我国图书情报研究的网络学术资源利用特征与趋势探究——基于四种权威期刊2010-2014年的引文分析

大数据时代科技情报服务的挑战与思考

基于INFOMINE导航模式下的网络科普资源导航建设研究

任务复杂性与用户认知和Web导航行为关系探究

基于朴素贝叶斯的文本分类研究综述

基于多维度聚合的网络资源知识发现框架研究

国外灰色文献领域研究态势分析——基于自组织映射的文本挖掘方法

基于SVR模型的中文领域术语自动抽取研究——面向图书情报领域

网络检索结果聚类研究综述

从中文问答社区信息内容透视公众针对突发事件的信息需求——基于问题胶囊事件的实验研究

期刊信息

《情报学报》
北大核心期刊（2011版）

主管单位:中国科学技术协会
主办单位:中国科学技术情报学会中国科学技术信息研究所
主编：戴国强
地址：北京复兴路15号
邮编：100038
邮箱：qbxb@istic.ac.cn
电话：010-68598273

国际标准刊号：ISSN：1000-0135
国内统一刊号：ISSN：11-2257/G3
邮发代号:82-153

获奖情况:
1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用

国内外数据库收录:
俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:19778