位置:成果数据库 > 期刊 > 期刊详情页
受限领域问答系统的中文问句分析研究
  • ISSN号:1000-3428
  • 期刊名称:《计算机工程》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]华中科技大学电子信息与通信学院,湖北武汉430000, [2]安阳师范学院计算机与信息工程学院,河南安阳455000
  • 相关基金:国家自然科学基金项目(60663004);河南省高等学校青年骨干教师项目(2009GGJS-108)
中文摘要:

针对汉语词性标注中词性类别划分较细、类别较多的问题,提出一种利用双层条件随机场进行汉语词性标注的方法,该方法将汉语词性标注分为两个阶段,每个阶段采用一层条件随机场建模实现。第一阶段底层条件随机场根据上下文产生每个词语的词性粗分结果;第二阶段高层条件随机场将词语及其粗分结果作为上下文特征对每个词语的词性进一步细分,产生最终词性标记。利用CRF++0.53工具包,在国际汉语分词评测Bakeoff2007(国际汉语分词评测)的NCC和CTB语料上进行了实验,结果表明该方法可行且可以获得较好的标注结果。

英文摘要:

Chinese part-of-speech tagging often has the problem of too many well defined lexical catalogs. To improve this problem,the paper proposes a Chinese part-of-speech tagging method based on Dual-Lay-er conditional random fields.The approach divides the tagging procedure into two stages,each of which uses single-lyer conditional random fields to complete modeling.The first stage using context achieves coarse -grained part-of-speech tagging of each word.Taken the coarse-grained result as features,the second stage further produces sequences of fine-grained part-of-speech tags.Closed evaluations are performed on NCC and CTB corpus from the Bakeoff-2007 ,and comparative experiments are performed on different feature tem-plates.Experimental results show that this approach can obtain better pos tagging set.

同期刊论文项目
期刊论文 23 会议论文 5
同项目期刊论文
期刊信息
  • 《计算机工程》
  • 北大核心期刊(2014版)
  • 主管单位:中国电子科技集团公司
  • 主办单位:华东计算技术研究所 上海市计算机学会
  • 主编:游小明
  • 地址:上海市桂林路418号
  • 邮编:200233
  • 邮箱:ecice06@ecict.com.cn
  • 电话:021-64846769
  • 国际标准刊号:ISSN:1000-3428
  • 国内统一刊号:ISSN:31-1289/TP
  • 邮发代号:4-310
  • 获奖情况:
  • 1999~2000、2001~2002年度信息产业部优秀期刊奖,2003-2004、2005-2006年度信息产业部电子精品科技...,2007-2008、2009-2010年度工业和信息产业部电子精...,012年度中国科技论文在线优秀期刊一等奖,2013年度中国科技论文在线优秀期刊二等奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:84139