位置:成果数据库 > 期刊 > 期刊详情页
基于条件随机场的语义角色标注
  • ISSN号:1003-7985
  • 期刊名称:《东南大学学报:英文版》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北京理工大学计算机科学技术学院,北京100081, [2]安阳师范学院计算机与信息工程学院,安阳455000, [3]昆明理工大学信息工程与自动化学院,昆明650051
  • 相关基金:The National Natural Science Foundation of China (No. 60663004), the Ph. D. Programs Foundation of Ministry of Education of China (No. 20050007023).
中文摘要:

由于语义角色标注对深层次的自然语言处理非常必要,提出了一种基于条件随机场的语义角色标注方法.该方法以浅层句法分析为基础,把短语或命名实体作为标注的基本单元,将条件随机场模型用于句子中谓词的语义角色标注.该方法的关键在于模型的参数估计和特征选择.具体应用中采用L-BFGS算法学习模型参数,并选择基于句法成分的、基于谓词的、句法成分-谓词关系三类特征作为模型特征集.在CoNLL-2005评测任务所提供的数据集上的实验结果表明:基于条件随机场的方法比基于最大熵模型的方法性能更好.该方法在语义角色标注任务上获得了80.43%的准确率和63.55%的召回率.

英文摘要:

Due to the fact that semantic role labeling (SRL) is very necessary for deep natural language processing, a method based on conditional random fields (CRFs) is proposed for the SRL task. This method takes shallow syntactic parsing as the foundation, phrases or named entities as the labeled units, and the CRFs model is trained to label the predicates' semantic roles in a sentence. The key of the method is parameter estimation and feature selection for the CRFs model. The L-BFGS algorithm was employed for parameter estimation, and three category features: features based on sentence constituents, features based on predicate, and predicate-constituent features as a set of features for the model were selected. Evaluation on the datasets of CoNLL-2005 SRL shared task shows that the method can obtain better performance than the maximum entropy model, and can achieve 80. 43 % precision and 63. 55 % recall for semantic role labeling.

同期刊论文项目
期刊论文 23 会议论文 5
同项目期刊论文
期刊信息
  • 《东南大学学报:英文版》
  • 主管单位:教育部
  • 主办单位:东南大学
  • 主编:毛善锋
  • 地址:南京市四牌楼2号
  • 邮编:210096
  • 邮箱:xuebao@seu.edu.cn
  • 电话:025-83794323 83794343传
  • 国际标准刊号:ISSN:1003-7985
  • 国内统一刊号:ISSN:32-1325/N
  • 邮发代号:
  • 获奖情况:
  • 2010年和2012年荣获第三届和第四届中国高校优秀科...
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库
  • 被引量:493