位置:成果数据库 > 期刊 > 期刊详情页
基于词对依存分类的藏语树库半自动构建研究
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:2013.9.15
  • 页码:166-172
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]青海师范大学藏文信息研究中心,青海西宁810008, [2]中国科学院计算技术研究所智能信息处理重点实验室,北京100190, [3]陕西师范大学计算机学院,陕西西安710062
  • 相关基金:国家自然科学基金资助项目(61063033,61163018,61363055);教育部“春晖计划”合作科研资助项目(Z2012102)
  • 相关项目:藏文字符信息熵研究
中文摘要:

依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,校对构建了1.1万句藏语依存句法树后,在基线系统下经实验验证,依存识别正确率提高了3%,使构建藏语依存树库工作取得了有效进展。

英文摘要:

According dependency syntactic theory this paper gave Tibetan typed dependencies and its hierarchy,and then we analyzed some problems in building Tibetan dependency Treebank.We proposed a mode to construct dependency tree semi-automatically,it includes word-pairs dependency classification model and dependency edges annotation model with rich features template based on Tibetan language grammar.And we implemented visualized tool which used to build and proofreading 11thousand sentences Treebank.On the baseline system the experimental results show that,the dependency recognition accuracy obtains an improvement of 3%.

同期刊论文项目
期刊论文 27 会议论文 9
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136