位置:成果数据库 > 期刊 > 期刊详情页
关联词搭配的自动发现
  • ISSN号:1001-3695
  • 期刊名称:《计算机应用研究》
  • 时间:0
  • 分类:H146.2[语言文字—汉语]
  • 作者机构:[1]华中师范大学语言与语言教育研究中心,武汉430079, [2]湖南省第一师范学院信息科学与工程系,长沙410205
  • 相关基金:国家自然科学基金资助项目(60703008);国家重点实验室开放研究基金资助项目(SKLSE04-018);教育部人文社科重点研究基地重大资助项目(10JJD740012);湖北省科技攻关资助项目(2007AA101C49)
中文摘要:

提出了关联词搭配模式自动发现的基本方法。建立一个大规模语料库,然后作分词处理,并对关联词进行自动标注和人工校对;评估关联词搭配的三个重要参数(搭配距离、搭配强度MI值、搭配强度Z值),并设定阈值,超过阈值的格式自动作为候选搭配模式。通过实验,标注的准确率为88.75%,表明本方法具有较好效果。运用该方法,发现了以往大量未被注意的句法搭配模式,对研制高质量的关联词知识库起到了积极的促进作用,对复句句法、语义的自动分析具有重要的意义。

英文摘要:

This paper provided a method of the automatic discovery of the conjunctions' collocation pattern. Built a large corpus, and it was tagged by a Chinese automatic segmenting system, and tagged and proofed the connects words artificially. Set a threshold, and regard the collocation whose parameters were above of the value as candidates for the collocation pattern. The accuracy of tagging was 88.75% ,which indicated that this method was feasible. Many syntactic patterns are discoved in the research which will promot buliding a top-quality knowledge base of connects words. And it has vital significance in automatic analysis of the syntactic and semantic of compund sentences.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用研究》
  • 北大核心期刊(2011版)
  • 主管单位:四川省科学技术厅
  • 主办单位:四川省计算机研究院
  • 主编:刘营
  • 地址:成都市成科西路3号
  • 邮编:610041
  • 邮箱:arocmag@163.com
  • 电话:028-85210177 85249567
  • 国际标准刊号:ISSN:1001-3695
  • 国内统一刊号:ISSN:51-1196/TP
  • 邮发代号:62-68
  • 获奖情况:
  • 第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:60049