东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于潜在语义分析和改进的HS—SVM的文本分类模型研究

ISSN号：0252-3116
期刊名称：《图书情报工作》
时间：0
分类：G350[文化科学—情报学]
作者机构：[1]武汉大学信息资源研究中心,武汉430072
相关基金：本文系教育部人文社会科学重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究”（项目编号：08JJD870225）研究成果之一.

作者：张玉峰[1], 何超[1]

关键词：文本分类, 潜在语义分析, 改进的超球支持向量机, 重叠区域文本, text classification latent semantic analysis improved hyper-sphere support vector machine text in overlapping regions

中文摘要：

为提高文本分类的准确性与效率，提出一种基于潜在语义分析和改进的超球支持向量机的文本分类模型。该模型利用潜在语义分析进行特征抽取，消除同义词和多义词在文本表示时所造成的偏差，实现文本向量的降维。针对超球重叠区域的文本分类问题，设计一种新的决策方法一基于密集度的决策策略。实验结果表明，该模型在类别数目较小时具有较好的分类效果，改进的算法有效可行。

英文摘要：

A text classification model, which is based on Latent Semantic Analysis and Improved of Hyper-sphere Support Vector Machine, is proposed in order to improve the accuracy and efficiency of text classification. Using the latent semantic analysis for feature extraction in this model, the affect of synonymy and polysemy in text representation process is eliminated and the dimension of text vector is reduced. A new approach to decision making, which is based on the intensity, is designed for the text classification of ultra-overlapping regions in the ball. Experimental results show that the model will give a good classification results when the number of the classes is small. The improved algorithm is effective and feasible.

同期刊论文项目

　基于智能信息处理的知识挖掘技术及应用研究

期刊论文 40

同项目期刊论文

基于Wiki的数字图书馆信息服务平台研究

面向案例的隐性知识挖掘方法研究

互联网舆情演化的动态网络模型研究

基于联机分析挖掘的动态竞争情报多维语义分析研究

基于领域本体的竞争情报聚类分析研究

基于本体的竞争情报语义整合与分析研究

基于Web挖掘的网络舆情智能分析研究

基于数据挖掘的个人身份信息自动识别模型研究

基于领域本体的语义文本挖掘研究

基于语义准则函数的中文评论性文本极性聚类算法研究

基于社会网络视角的竞争情报人员之间知识协作研究

A Study on the design method of KPI system in Chinese communication enterprises

洛特卡现象在汉语词汇句法功能分布复杂度中的呈现

基于Web挖掘技术的用户兴趣本体学习研究

基于粒子群优化的文档聚类算法

泛在知识环境中数据挖掘技术进展分析

基于数据挖掘银行客户信用风险评级体系研究

基于内容相似性的论坛用户社会网络挖掘

基于一阶概率推理的知识挖掘研究

文本分类中的语义核函数研究

数字图书馆中用户访问模式挖掘方法研究

基于混合策略的英汉双语新闻聚类研究

基于数据挖掘的Web文本语义分析与标注研究

Visualization Mining Methods of Telecom Companies＇ Topic Data Model

Topic Model Optimization and Data Mining under the eTOM Framework

基于聚类分析的学科交叉研究

基于数据挖掘的Web文本不良信息监测模型研究

基于数据挖掘的图书智能推荐系统研究

基于潜在语义分析和HS-SVM的文本分类模型研究

基于知识发现的企业技术竞争情报挖掘（Ⅰ）——目标识别与流程设计

基于OWL本体的知识表示研究

基于知识发现的企业技术竞争情报挖掘（Ⅱ）——策略与实证分析

基于支持向量机的医学期刊文章自动分类研究

基于核心句及句法关系的评价对象抽取

学科交叉知识挖掘模型研究

通用领域中文评论的意见挖掘研究

基于Web评论挖掘的动态竞争情报分析研究（上）——问题分析与模型构建

基于Web评论挖掘的动态竞争情报分析研究（下）——算法设计与实验分析

Stemming和Lemmatization对英文文本聚类的影响研究

期刊信息

《图书情报工作》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国科学院文献情报中心
主编：初景利
地址：北京中关村北四环西路33号
邮编：100190
邮箱：journal@mail.las.ac.cn
电话：010-82623933 82626611-6614

国际标准刊号：ISSN：0252-3116
国内统一刊号：ISSN：11-1541/G2
邮发代号:2-412

获奖情况:
多次荣获"全国图书馆学优秀期刊"、"全国优秀科技...,2005年，更荣获中国国家期刊奖二等奖，是本届唯一...

国内外数据库收录:
中国中国人文社科核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:57601