东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

一种面向文本分类的特征迁移方法

ISSN号：1004-9037
期刊名称：《数据采集与处理》
时间：0
分类：TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
作者机构：山西大学计算机与信息技术学院,太原030006
相关基金：国家自然科学基金（60975035,61273291）资助项目;山西省回国留学人员科研基金（2012008）资助项目.

作者：赵世琛, 王文剑

关键词：文本分类, 迁移学习, 迁移量, 向量空间模型, text categorization, transfer learning, transfer volume, vector space model

中文摘要：

传统的文本分类方法假设训练集与测试集中的特征词服从相同的概率分布，但在实际应用中，以上假设存在偏差，会影响到最终的分类结果。针对这一情况，本文采用迁移学习，通过计算特征词的迁移量对训练集中向量空间模型进行修正，最终使训练集与测试集中特征词的分布概率趋于一致。将提出的方法应用于中文垃圾邮件过滤与中、英文网页分类中，在CHI统计特征选择基础上进行特征迁移，实验结果表明新方法可以有效消除特征词分布的差异性，使文本分类的各项指标明显提高。

英文摘要：

Traditional text classification methods assume that feature words in the training set and test set follow the same probability distribution. Nevertheless, deviations exist in a practical application, which can affect the final classification results. To solve the problem, a feature transfer learning algorithm for text categorization is proposed. By calculating the transfer volume and amending the vector space model in the training set, the distribution probability of feature words can be reconciled for the training set and test set. Experiments on Chinese spam filtering and web page classification data sets demonstrate that the proposed method can eliminate the dissimilarity of distributions of feature words, and improve the va rious indexes of test classification evidently.

同期刊论文项目

　超声波冷热量表

期刊论文 122

粒度支持向量机学习方法及应用研究

期刊论文 32 会议论文 1

提高支持向量机处理复杂数据效能的方法研究

期刊论文 26

同项目期刊论文

处理非平衡数据的粒度SVM学习方法

一种基于二次分割的多特征图像分类方法

处理非平衡数据的粒度SVM学习算法

基于训练样本自动选取的SVM彩色图像分割方法

基于区域显著性的活动轮廓分割模型

Facilitating the applications of support vector machine by using a new kernel

一种基于环形分布的SVM核选择方法

Learning linear and nonlinear PCA with linear programming

一种基于球状分布的SVM核选择方法

Approximations of the standard principal components analysis and kernel PCA

民间传统工艺品的三维仿真

基于结构化支持向量机的中文句法分析

An approximate extreme learning machine for large data set classification

基于粒度偏移因子的支持向量机学习方法

基于支持向量机分类问题的勒让德核函数

基于数据关系的SVM多分类学习算法

基于概率密度分布的增量支持向量机算法

基于粒分布的支持向量机加速训练方法

动态粒度支持向量回归机

基于主动学习的模式类别挖掘模型

基于正交多项式的核函数性质研究

一种处理结构化输入输出的中文句法分析方法

动态粒度SVM学习算法

基于区域显著性的活动轮廓分割模型

时序数据曲线排齐的相关性分析方法

基于粒度偏移因子的支持向量机学习方法

经济周期波动的函数型时序分解方法——基于CPI的实证分析

基于概率密度分布的增量支持向量机算法

基于粒分布的支持向量机加速训练方法

动态粒度支持向量回归机

基于多学习器协同训练模型的人体行为识别方法

一种基于Petri网的Web服务选择方法

基于选择性集成旋转森林的人体行为识别算法

基于关联关系分析的符号数据分类方法

不确定感知的自适应云计算服务组合

面向函数型数据的快速特征选择方法

一种基于数据分布的SVM核选择方法

一种基于圆形分布的支撑向量机核选择方法

基于主动学习的模式类别挖掘模型

一种快速均值飘移图像分割算法

高斯核函数选择的广义核极化准则

基于组合半监督的增量支持向量机学习算法

基于正交多项式的核函数性质研究

基于非均匀采样的相关系数最大化曲线排齐方法

一种处理结构化输入输出的中文句法分析方法

动态粒度SVM学习算法

基于盖根鲍尔多项式的SVM核函数

一类新的支持向量机核函数——埃尔米特核函数

一类新的基于拉盖尔正交多项式的核函数

一种新的支持向量机主动学习策略

基于视觉注意的SVM彩色图像分割方法

基于虚拟现实技术的山西大学堂建筑复原

基于虚拟现实技术的大型场景视景仿真

一种高斯区间核SVM分类模型

磁性MCM-41/CdS的制备及其可见光催化性能研究

铝球弹丸高速正撞击铝网防护屏破碎特性的数值模拟研究

新型配式混凝土楼盖π式板缝连接节点抗剪性能研究

不同环境温度下铝球弹丸高速撞击编织物防护屏试验研究

隧道沥青路面阻燃剂的现状与发展

Bi(25)FeO_40-g-C_3N_4磁性催化剂的制备及其可见光催化性能

儿童川崎病临床特征及并发冠脉损害的高危因素分析

聚丁二酸丁二醇酯降解菌株的筛选及其降解性能研究

针对虫洞攻击的无线传感器网络安全定位方法

通用型肠道病毒感染重症手足口病临床病理特点分析

水通道蛋白4和P65在肠道病毒71型感染合并神经源性肺水肿脑与肺组织的表达及意义

动态粒度支持向量回归机

大功率LED灯合成双射流主动散热费用模型研究

三层铝板结构高速撞击损伤与极限特性

基于随机情景模拟统计的海洋溢油污染风险分析——以滨州贝壳堤岛与湿地国家级自然保护区为例

基于电磁超声兰姆波的铝合金板材小缺陷检测技术研究

曲折线圈型电磁超声表面波换能器的优化设计

Prognostic value of perioperative leukocyte count in resectable gastric cancer

动力扰动下深部巷道卸压孔与锚杆联合支护的数值模拟

豨莶草提取物抗多柔比星致大鼠急性心肌损伤的作用

豨莶草醇提物对多柔比星致小鼠慢性心肌损伤的保护作用

多柔比星心脏毒性及其中药防治研究进展

碳锁定效应的内涵、作用机制与解锁路径研究

缺失ATP合酶和插入VHb基因对钝齿棒杆菌谷氨酸产量的影响

不同萃取头对木香薷挥发性物质成分分析

循证护理干预在防治混合痔术后排尿困难及尿潴留中的应用研究

特效植物营养素对迟菜心淀粉酶活力及种子后代的影响

美国 SEC 新准则下油气藏类比方法研究

老年2型糖尿病患者尿路感染的临床特点及相关因素分析

动漫作品的幼儿语言教育研究

从事实存在到实践生成：课程理解的转向

自然循环蒸汽发生器并联倒U型管流量分配计算

光照强度对狐臭柴植株生长及叶片生理生化指标的影响

不同地域莱氏野村菌的培养性状及对斜纹夜蛾的毒力

1种生物滤池清理方法对循环水养殖系统氨氮去除率的影响分析

孕妇孕期被动吸烟现状及KAP调查

肠道病毒71型致神经源性肺水肿机制研究进展

特效植物营养素对特色蔬菜迟菜心的增产效应

孕妇孕期被动吸烟与抑郁情绪的相关性研究

电磁超声兰姆波换能器多目标优化设计

电磁超声表面波换能器发射过程的精确建模与分析

甘薯及其近缘野生种三浅裂野牵牛（Ipmoeatrifida）原生质体融合的初步研究

嵌顿痔中医护理

道路表面动水压力的计算和分析

豨莶草提取物对抗多柔比星致大鼠急性肝肾损伤的作用及其机制

鲜乳中常见污染细菌的分离与鉴定

11S球蛋白改性前后的结构表征

双酶酶解11S球蛋白的工艺优化研究

微流控芯片上光纤激光对细胞的作用机理

特效植物营养素对不同时期种植迟菜心产量的影响

运城市体育旅游的RMP实证研究

从雁门清高看山西土特农产品文化营销之道

东太平洋海隆热液区嗜热深海偏顶蛤（Bathymodiolus thermophilus）的形态和分布特征

外源硼酸对栝楼种子萌发特性的影响

特效植物营养素的表观遗传效应对沙糖桔产量及生化性状的影响

大果期喷施特效植物营养素对荔枝增产效果及相关性状的影响

特效植物营养素对龙眼增产效果及相关性状的影响

步甲研究进展

深海中喷洒分散剂后溢油运动轨迹预测

我国城市社区公共服务模式的发展历程与启示

钆和钬变质对铝-硅-镁合金铸态组织的影响

基于四波段模型的巢湖水体藻蓝素浓度反演

高职食品类专业无机化学与分析化学课程整合的探索与实践

人力资本视角的农民工城市化研究综述及展望

利用GNSS高频数据分析研究大震同震响应

虚拟现实技术在水污染控制教学中的应用研究

3＋1培养模式软件类专业毕业设计过程管理及评价

体育诚信的制度研究:规范与约束

误差流聚类分析对浦东新区公共场所处罚案件质量控制应用分析

基于 Unity3D 的重力坝仿真系统开发研究

黑石顶动物学实习报告

动漫在学前儿童教育中的功能分析

PBL教学法与LBL教学法在外科学临床实习教学中应用的比较

新时期中国话剧舞台空间的转换——基于《荒原与人》的考察

长沙市和临湘县小地老虎的发生规律与防治方法

“四进四化”：临床实习生党员教育管理模式创新

长三角地区农民资金互助合作社运行满意度及影响因素分析——以泰州市苏陈资金互助合作社为例

经济适用房的财政金融政策支持效应的实证分析——基于江苏省1997—2010年的经验数据

炎热气候条件下筏板基础大体积混凝土防裂分析

薛瑄心学简论

沿海农区大棚冬草莓与鲜食糯玉米轮作高效栽培模式

大类招生下利用协同创新培养应用型创新人才的探索

长运距重型带式输送机自移式机尾的改进设计

两种康复程序在急性心肌梗死患者介入术后心脏康复中的应用效果观察

工学结合模式下高职院校学生思想动态与管理研究——以安徽机电职业技术学院为例

交通事故对城市路面通行能力的影响

陕西省GNSS连续观测系统建设与应用

山西农产品网络营销模式研究

多媒体教学在水污染控制工程教学中的应用

池州市城郊农地流转调查研究

新形势下船舶专业的人才培养探讨

基于模糊综合分析法的农产品绿色物流系统综合绩效评价——以新疆为例

基于Unity3D的水污染控制工程多媒体课件开发

互动学习在数学分析课程中的应用研究

肛周基底细胞癌误诊为肛周脓肿一例

建筑工业化新进展融入土木工程专业教学的探索与实践

软件类专业毕业设计教学实践的思考与探索

新型压缩空气储能风电系统膨胀助力控制

计算机学科拔尖创新人才小班制培养

产业链中间产品定价的公差带模型

狐臭柴叶片中果胶提取条件的初步研究

直肠黏膜柱状缝扎固定术结合硬化剂注射治疗直肠内脱垂疗效观察

耳穴贴压护理改善糖尿病便秘的疗效观察

涂布法与点滴法在循环水养殖系统细菌总数测定中的应用比较

抗肠炎功能蛋白缓解循环水养殖大西洋鲑环境应激的作用

密度矩阵的表示

海洋保护区生态风险综合评价方法初步研究——以滨州贝壳堤岛与湿地国家级自然保护区为例

城市低碳发展路线图编制：技术要素与改进建议

针刺治疗混合痔术后便秘65例临床观察

柱状缝扎术治疗环状混合痔36例临床观察

两类可观测量的Bell不等式

低碳城区评价指标体系研究初探

降钙素原对指导重症手足口病使用抗生素的价值

关公文化旅游节的体育赛事开发研究

多模式直流电源控制研究

河东体育旅游的RMP研究

数学分析中传统教学与翻转课堂实证对比分析

真菌性外耳道炎的临床路径评价

妊娠时间生物学的研究进展

期刊信息

《数据采集与处理》
北大核心期刊（2011版）

主管单位:中国科学技术协会
主办单位:中国电子学会仪器仪表学会信号处理学会中国一汽仪表学会中国物理学会微弱信号检测学会南京航空航天大学
主编：贲德
地址：南京市御道街29号
邮编：210016
邮箱：sjcj@nuaa.edu.cn
电话：025-84892742

国际标准刊号：ISSN：1004-9037
国内统一刊号：ISSN：32-1367/TN
邮发代号:28-235

获奖情况:
中国科技论文统计源用刊,2007年被评为江苏省优秀期刊

国内外数据库收录:
俄罗斯文摘杂志,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）

被引量:8148