位置:成果数据库 > 期刊 > 期刊详情页
基于SVR模型的中文领域术语自动抽取研究——面向图书情报领域
  • ISSN号:1000-7490
  • 期刊名称:《情报理论与实践》
  • 时间:0
  • 分类:H083[语言文字—语言学]
  • 作者机构:南京大学信息管理学院,江苏南京210093
  • 相关基金:本文为国家社会科学基金重大招标项目“面向学科领域的网络信息资源深度聚合与服务研究”的成果.项目编号:12&ZD221.
作者: 蒋婷, 孙建军
中文摘要:

[目的/意义]术语是本体的重要组成部分,术语自动抽取是本体自动构建的基础,文章采用回归的方法对未登录词进行概率(某个数值(组合)对应的候选词集合中术语的概率)预测,获得该词可能为术语的概率。[方法/过程]文章结合语言学和统计方法,通过构建术语库提取术语抽取模板来抽取候选术语,此外,通过引入回归的方法,将术语抽取问题转化为对词语成为术语的概率的预测问题。[结果/结论]提出的方法最后通过实验验证了其有效性。

英文摘要:

[ Purpose/significance ] Terminology is one of the most important parts of ontology. Automatic terminology extraction is the basis of automatic ontology construction. This paper adopts the method of regression to predict the probability of unknown words ( a value or combined values corresponds to the set of candidate words in terms of probability) . [ Method/process] The pa- per focuses on the combination of linguistics and statistical methods to extract the candidates based on rule-based method. By using the method of regression, the paper takes the terminology extraction problem as the prediction issue of terminology probability. [ Result/conclusion ] The experiment verifies the validation of the proposed method.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报理论与实践》
  • 北大核心期刊(2011版)
  • 主管单位:中国兵器工业集团公司
  • 主办单位:中国国防科学技术信息学会 中国兵器工业集团第二一零研究所中国兵器工业第二一0研究所
  • 主编:王忠军
  • 地址:北京2413信箱10分箱
  • 邮编:100089
  • 邮箱:ita@onet.com.cn
  • 电话:010-68961793 68963306
  • 国际标准刊号:ISSN:1000-7490
  • 国内统一刊号:ISSN:11-1762/G3
  • 邮发代号:82-436
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国人文社科核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:26785