位置:成果数据库 > 期刊 > 期刊详情页
一种处理结构化输入输出的中文句法分析方法
  • ISSN号:1003-0077
  • 期刊名称:《中文信息学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]山西大学计算机与信息技术学院,山西太原030006
  • 相关基金:国家自然科学基金(60975035,61273291);山西省回国留学人员科研资助项目(2012-008)
中文摘要:

中文句法结构复杂,特征维数较高,目前已知最好的汉语句法分析效果与其他西方语言相比还有一定的差距.为进一步提高中文句法分析的效率和精度,该文提出一种采用二阶范数软间隔优化的结构化支持向量机(Structural Support Vector Machines,Structural SVMs)方法对基于短语结构的中文句法进行分析,通过构造结构化特征函数(ψ)(x,y),体现句法树的输入信息,并根据中文句子本身具有的强相关性,在所构造的(ψ)(x,y)中增加中文句法分析树中父节点的信息,使(ψ)(x,y)包含了更加丰富的结构信息.在宾州中文树库PCTB上的实验结果表明,该文方法与经典结构化支持向量机方法以及Berkeley Parser相比可取得较好的效果.

英文摘要:

Chinese syntax has complex structure and high dimension features, and the best known Chinese parsing performance is still inferior to that of other western languages. In order to improve the efficiency and accuracy of Chinese parsing, we propose a L2-norm soft margin optimization structural support vector machines (structural SVMs) approach. By constructing the structural function ~(x,y), the input information of syntactic tree can be mapped well. Since Chinese syntax has a strong correlation, we use father node of phrase structure trees to enrich the structure information of ~(x,y). The experiment results on the benchmark dataset of PCTB demonstrate that the proposed approach is effective and efficient compared with classical Structural SVMs and Berkeley Parser system.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136