位置:成果数据库 > 期刊 > 期刊详情页
面向英语文章的词性标注算法
  • ISSN号:1007-5321
  • 期刊名称:《北京邮电大学学报》
  • 时间:0
  • 分类:TN911.22[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]北京邮电大学智能科学与技术中心,北京100876
  • 相关基金:国家自然科学基金项目(61273365)
中文摘要:

面向英语文章的词性标注是对英语文章实现自动批改的基础,虽然研究者对英语词性标注做了大量有益的研究,但是大多数的研究都面向英语为第一语言的用户,而面向英语为第二语言用户的相关研究则很少.为此,对以英语为第二语言用户的英语文章进行了人工标注,在此基础上提出了一种面向英语文章的词性标注算法,融合了词聚类、无标语料统计信息、单词发音等特征.实验结果表明,该算法能有效提高词性标注性能,标注正确率从94.49%可提高到97.07%.

英文摘要:

Part-of-speech tagging for Chinese English learner language is the base of automated essay scoring system. Much of fruitful part-of-speech tagging researches researchers was done,however,most of them are focused on the English essays written by native speaker,there is no research about essays of Chinese English learner. A corpus of Chinese English learner essay are annotated,and a part-of-speech tagging algorithm for Chinese English learner language is presented. This algorithm uses rich features,such as unsupervised word clusters,unsupervised tag dictionary and phonetic normalization. Based on these rich features,the system outperforms the state-of-art tagging on the corpus,and the tagging accuracy is raised from 94. 49% to 97. 07%.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《北京邮电大学学报》
  • 北大核心期刊(2011版)
  • 主管单位:教育部
  • 主办单位:北京邮电大学
  • 主编:刘杰
  • 地址:北京海淀区西土城路10号195信箱
  • 邮编:100876
  • 邮箱:byxb@bupt.edu.cn
  • 电话:010-62281995 62282742
  • 国际标准刊号:ISSN:1007-5321
  • 国内统一刊号:ISSN:11-3570/TN
  • 邮发代号:2-648
  • 获奖情况:
  • 美国工程信息公司(Ei)数据库收录期刊,1999年全国优秀高等学校自然科学学报及教育部优秀...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:7684