东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于领域本体的文本资料聚类算法改进研究

ISSN号：1007-7634
期刊名称：情报科学
时间：2013.6.5
页码：129-134
分类：G254[文化科学—图书馆学]
作者机构：[1]湖南大学工商管理学院,湖南长沙410079
相关基金：国家自然科学基金（71201052）; 湖南大学青年教师基金项目
相关项目：基于语义的上市公司年报文本信息质量测度方法及应用

作者：龚光明|王薇|蒋艳辉|周双文|

关键词：文本挖掘, 相似度, 聚类, 语义, text mining, similarity, clustering, semantics

中文摘要：

针对由领域本体匹配产生的文本特征矩阵,描述了一种基于改进相似度计算公式的文本资料聚类算法。实验证明,当我们以生物医药领域的文本作为实验样本时,不管是从熵值还是从纯度来考虑,基于领域本体改进的聚类算法都要优于K-means算法和凝聚层次聚类算法。

英文摘要：

This paper describes a new clustering method for texts based on an improved similarity calcula tion formula for text feature matrix which is generated by domain ontology matching.The experiment shows that： when they use texts in the field of bio-medicine as the experimental samples,the new cluster ing method for texts based on an improved similarity calculation formula is better than the K-means clus tering method and agglomerative hierarchical clustering method from entropy and purity considerations.

同期刊论文项目

基于语义的上市公司年报文本信息质量测度方法及应用

期刊论文 26 会议论文 3

同项目期刊论文

An ontology-based semantic clustering algorithm for accounting text

Optimal Deployment and Scheduling with Directional Sensors for Energy-Efficient Barrier Coverage

云计算平台下研究生学习效率研究——基于一项实验研究

Comparison of Infrared Spectroscopy and Nuclear Magnetic Resonance Techniques in Tandem with Multiva

研发投入、研发项目进展与股价波动——基于创业板上市高新技术企业的实证研究

引入“在线社会网络”的三重螺旋创新系统模型研究

创业板上市公司文本惯性披露、信息相似度与资产定价——基于Fama-French改进模型的经验分析

会计稳健性视阈下管理者过度自信对企业R&D投入的影响研究——基于A股高新技术企业的经验研究

董事会资本、产权性质与R&D资本化——来自A股信息技术业上市公司的经验研究

强制披露制度下的企业内部控制信号传递研究

智力资本互联网信息披露、分析师跟踪与企业价值

智力资本多源化信息披露、分析师跟踪与企业价值的关系——来自A股主板高新技术企业的经验证据

机构投资者异质性与上市公司R&D投入——来自A股市场高新技术企业的经验研究

MD&A语言特征、管理层预期与未来财务业绩——来自中国创业板上市公司的经验证据

机构投资者异质性与应计和真实盈余管理

机构投资者异质性、真实盈余管理与现金分红

制度环境、机构投资者异质性与企业真实盈余管理行为

一种基于领域本体的药品研发信息抽取方法

MD＆A语言特征、管理层预期与未来财务业绩——来自中国创业板上市公司的经验证据

机构投资者异质性与上市公司R＆D投入——来自A股市场高新技术企业的经验研究

新媒体信息披露对股票市场的影响研究——来自“互动易”平台的证据

期刊信息

《情报科学》
北大核心期刊（2011版）

主管单位:国家教育部
主办单位:中国科学技术情报学会吉林大学
主编：靖继鹏
地址：长春市人民大街5988号
邮编：130022
邮箱：infosci@jlu.edu.cn
电话：0431-85095200

国际标准刊号：ISSN：1007-7634
国内统一刊号：ISSN：22-1264/G2
邮发代号:12-174

获奖情况:
全国中文核心期刊,2001年被评为吉林省科技类一级期刊

国内外数据库收录:
日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:36930