位置:成果数据库 > 期刊 > 期刊详情页
张量分解在用户影响力度量中的应用
  • ISSN号:1000-2243
  • 期刊名称:《福州大学学报:自然科学版》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]福州大学物理与信息工程学院,福州350116, [2]福建江夏学院电子信息科学学院,福州350108, [3]福州大学数学与计算机科学学院,福州350116, [4]福州大学福建省网络计算与智能信息处理重点实验室,福州350116
  • 相关基金:国家自然科学基金青年基金项目(No.61300105)、教育部博士点基金联合项目(No.2012351410010)、福建省科技重大专项项目(No.2013H6012)、福州市科技计划项目(No.2013-PT-45,2012-G-113)资助
中文摘要:

属性抽取可分为对齐和语义标注两个过程,现有对齐方法中部分含有相同标签不同语义的属性会错分到同一个组,而且为了提高语义标注的精度,通常需要大量的人工标注训练集.为此,文中提出结合主动学习的多记录网页属性抽取方法.针对属性错分问题,引入属性的浅层语义,减少相同标签语义不一致的影响.在语义标注阶段,基于网页的文本、视觉和全局特征,采用基于主动学习的SVM分类方法获得带有语义的结构化数据.同时在主动学习的策略选择方面,通过引入样本整体信息,构建基于不确定性度量的策略,选择语义分类预测不准的样本进行标注.实验表明,在论坛、微博等多个数据集上,相比现有方法,文中方法抽取效果更好.

英文摘要:

The attribute extraction process can be separated into two phases, alignment and annotation. In the existing alignment methods, different semantic attributes are mistakenly aligned into the same group. Furthermore, to improve the accuracy of semantic annotation, time-consuming manual annotation is oftenintroduced to construct training set. To solve this problem, a multi-record webpage attribute extraction method combining active learning is presented. As for the problem of wrong attribute alignment, shallow semantic is integrated into the alignment approach to relieve the influence of same tags with different semantics. In the semantic annotation phase, textual, visual and global features are extracted for semantic classification and an active learning based SVM classifier is applied to extract structural data. Moreover, a new sample selection strategy is proposed by introducing the global sample information, and more informative samples with lower confidences are selected to be labeled. The experimental results on BBS and microblog datasets confirm the superiority the proposed method.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《福州大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:福州大学
  • 主办单位:福州大学
  • 主编:杨黄浩
  • 地址:福建省福州市大学新区学园路2号
  • 邮编:350116
  • 邮箱:xb@fzu.edu.cn
  • 电话:0591-22865030 22865031
  • 国际标准刊号:ISSN:1000-2243
  • 国内统一刊号:ISSN:35-1117/N
  • 邮发代号:34-27
  • 获奖情况:
  • 全国高校优秀自然科学学报,华东地区优秀期刊,福建省优秀科技期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:8994