位置:成果数据库 > 期刊 > 期刊详情页
一种基于规则的无监督词性标注方法
  • ISSN号:1671-5489
  • 期刊名称:《吉林大学学报:理学版》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]吉林大学计算机科学与技术学院,长春130012, [2]东北师范大学计算机科学与信息技术学院,长春130117
  • 相关基金:国家自然科学基金(批准号:71473035); 教育部人文社会科学研究项目(批准号:14YJA870010); 吉林省工业技术研究和开发项目(批准号:JF2012c016-2); 吉林省科技重点攻关项目(批准号:20150204040GX); 吉林大学研究生创新基金(批准号:2015040).
中文摘要:

提出一种基于规则的无监督词性标注方法,利用200多条英语语法规则,创建26个规则函数,先将输入的待标注英语句子进行预处理后得到初始标记,再对每个单词调用规则函数,最终得到标注后的英语句子.通过对Brown语料库的实验,词性标注的正确率达到93.95%.实验结果表明,本文方法可行、有效,能很好地提高英语词性标注的准确率.

英文摘要:

A rule-based tagging method for unsupervised part-of-speech was proposed.More than 200 grammar rules were used to create 26 kinds of rules functions.After it was preprocessed,the initial tags of words in the input sentence were obtained,the 26 kinds of rules functions were applied to each word to attain all the tags of the input sentence.Experimental results on Brown corpus show that the accuracy of our method is up to 93.95%,thus,our rule-based method is feasible and effective,and improves the accuracy and the simplicity of English part-of-speech tagging.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《吉林大学学报:理学版》
  • 北大核心期刊(2011版)
  • 主管单位:教育部
  • 主办单位:吉林大学
  • 主编:裘式纶
  • 地址:长春市南湖大路5372号
  • 邮编:130012
  • 邮箱:sejuj@mail.jlu.edu.cn
  • 电话:0431-88499428
  • 国际标准刊号:ISSN:1671-5489
  • 国内统一刊号:ISSN:22-1340/O
  • 邮发代号:12-19
  • 获奖情况:
  • 在吉林省、教育部及全国优秀科技期刊评比中共获奖1...,2008年被评为"中国精品科技期刊", 并获教育部"第...,2009年获全国高校科技期刊优秀编辑质量奖,并被吉...,2008年和2009年连续两次获"中国科技论文在线优秀期...,2010年获教育部"第三届中国高校优秀科技期刊"奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:6314