位置:成果数据库 > 期刊 > 期刊详情页
针对产品命名实体识别的半监督学习方法
  • ISSN号:1007-5321
  • 期刊名称:北京邮电大学学报
  • 时间:2013.4.4
  • 页码:20-23+54
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]浙江大学计算机科学与技术学院,杭州310027
  • 相关基金:基金项目:国家科技支撑计划项目(2012BAHl6F02);国家自然科学基金项目(61003254)
  • 相关项目:基于信任的服务协同机制与算法研究
中文摘要:

针对商务信息领域的产品命名实体,研究了产品命名实体各部分的结构特征和相互关系,建立了一个三层的半监督学习框架.该方法综合利用规则词典和统计的方法,建立一个隐条件随机场模型,可以更充分地利用自举得到数据的隐藏状态.在数码相机领域进行的实验结果表明,该方法只需要少量的手工标记数据就能较好地识别网页等文本中的产品命名实体.

英文摘要:

A semi-supervised approach based on a three-level framework for product named entity recog- nition is presented. The structure features and relationships among different parts of product named enti- ties are studied, and a combined method is applied. A hidden conditional random field model is built so as to utilize the hidden status of learned samples. The labels failed to be learned by the bootstrapping al- gorithm is considered as hidden statuses. Experiment in digital camera area shows that, with only a few manually labeled data, this method could recognize product named entities from text contents of web pa- ges very well.

同期刊论文项目
期刊论文 23 会议论文 4 专利 2
同项目期刊论文
期刊信息
  • 《北京邮电大学学报》
  • 北大核心期刊(2011版)
  • 主管单位:教育部
  • 主办单位:北京邮电大学
  • 主编:刘杰
  • 地址:北京海淀区西土城路10号195信箱
  • 邮编:100876
  • 邮箱:byxb@bupt.edu.cn
  • 电话:010-62281995 62282742
  • 国际标准刊号:ISSN:1007-5321
  • 国内统一刊号:ISSN:11-3570/TN
  • 邮发代号:2-648
  • 获奖情况:
  • 美国工程信息公司(Ei)数据库收录期刊,1999年全国优秀高等学校自然科学学报及教育部优秀...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:7684