位置:成果数据库 > 期刊 > 期刊详情页
框架元素语义核心词自动识别研究
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:115-121
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]山西大学计算机与信息技术学院,山西太原030006
  • 相关基金:国家自然科学基金资助项目(60970053); 山西省国际科技合作资助项目(2010081044); 山西省高校拔尖创新基金; 山西省实验室开放基金资助项目(2009011059-4); 太原市大学生创新创业项目(100115148)
  • 相关项目:汉语框架语义依存图自动抽取关键技术研究
中文摘要:

该文基于汉语框架网,利用框架核心依存图形式化地表示一个汉语句子,使得对句子能够进行深层语义理解。为了得到框架核心依存图,需要提取其中框架元素的语义核心词。该文较为系统地描述了框架元素的语义核心词的识别问题。我们利用条件随机场模型、最大熵模型和支持向量机模型来识别框架元素语义核心词,并分别对这三种不同的模型所选的特征集进行了分析,且通过构造不同的特征模板进行对比实验,选取其中较优的特征模板和模型。结果表明,条件随机场模型具有较好的识别性能,在对其特征模板做进一步改进的基础上,识别效率也得到一定的提高。其中对简单型和复合型短语类型框架元素语义核心词识别的平均正确率分别达到了97.34%和94.03%。

英文摘要:

The Frame Kernel Dependency Graph based on the Chinese FrameNet is adopted to convey the deep semantic understanding of a Chinese sentence.The Frame Kernel Dependency Graph is to be obtained by extracting the semantic core words of Frame Elements.The identification of the semantic core words of Frame Element is investigated by the Conditional Random Fields,the Maximum Entropy and the Support Vector Machine models.Various feature sets with respect to these three models are analyzed and different feature template settings are compared to select the optimum template and model.Experimental results show that the CRF model has the best performance.When its feature template is improved further,the results also increase to some extent.The average precision of experiment result achieves 97.34% and 94.03% for Frame Elements of simple and complex phrase type,respectively.

同期刊论文项目
期刊论文 9 会议论文 4 专利 1
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136