位置:成果数据库 > 期刊 > 期刊详情页
蒙古文词性标注研究
  • ISSN号:1000-5218
  • 期刊名称:《内蒙古大学学报:哲学社会科学版》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]杭州师范大学国际教育学院,浙江杭州311121, [2]内蒙古大学图书馆,内蒙古呼和浩特010021
  • 相关基金:国家社科基金项目(项目批准号:11&ZD188)
中文摘要:

笔者基于条件随机场(Conditional Random Field,CRF)和支持向量机(Support Vector Machine,SVM)模型,通过增加上下文、附加成分和蒙古文字母等特征,对蒙古文句长为8到25的将近4万个句子进行了词性标注的研究。研究表明,CRF模型和SVM模型在标注蒙古文词性方面都有比较好的结果,其中在考虑上下文和特征"连写的构形附加成分"的情况下,SVM模型标注蒙古文词性的准确率可以达到99%以上。

英文摘要:

In the tagging of 400,000 sentences of 8 to 25 words with the new Mongolian POS tagging set, Conditional Random Field (CRF) and Support Vector Machine (SVM) models are applied in analyzing the features such as the contexts, ag- glutinative inflectional suffix, and the letter distribution patterns of Mongolian words. Both models report satisfactory outcome, and the SVM with contextual features and the "agglutinative inflectional suffix" in particular reports a precision rate of over 99%.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《内蒙古大学学报:哲学社会科学版》
  • 北大核心期刊(2008版)
  • 主管单位:
  • 主办单位:内蒙古大学
  • 主编:张吉维
  • 地址:呼和浩特市赛罕区大学西路235号
  • 邮编:010021
  • 邮箱:ndxbrwsk@imu.edu.cn
  • 电话:0471-4992004
  • 国际标准刊号:ISSN:1000-5218
  • 国内统一刊号:ISSN:15-1051/C
  • 邮发代号:16-66
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国人文社科核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2000版)
  • 被引量:5269