位置:成果数据库 > 期刊 > 期刊详情页
CLUCENE在语料库建设中的应用
  • ISSN号:1672-1292
  • 期刊名称:南京师范大学学报(工程技术版)
  • 时间:0
  • 页码:118-122
  • 语言:中文
  • 分类:TP301[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]南京师范大学文学院,江苏南京210097, [2]南京师范大学数学与计算机科学学院,江苏南京210097, [3]西北民族大学藏语言文化学院,甘肃兰州730030
  • 相关基金:江苏省社会科学基金(07YYB003、06JSBYY001)、国家自然科学基金(60773173)、国家社会科学基金(07BYY050)、国家社会科学基金2005重点项目(05AYY001)和国家“973”计划(2004CB318102)资助项目.
  • 相关项目:汉语隐喻理解关键技术研究
中文摘要:

深入分析了现有语料库的构建模式和语料库应具备的功能模块,提出基于文件系统和Clucene全文检索引擎工具包的语料库建设方案.实验证明,Clucene具有丰富的接口设计和良好的扩展性,为语料库建设提供了一种较好的技术实现方式.

英文摘要:

This paper examines deeply the constructed models of the current corpus building design and the functions corpus should have. A new corpus design based on file system and Clucene full text searching engine package is pro- posed. Experiments show that Clucene provides various types of interfaces and can be easily extended for large quantity data. These characteristics make the package a promising platform for corpus building.

同期刊论文项目
期刊论文 21 会议论文 15 著作 2
同项目期刊论文
期刊信息
  • 《南京师范大学学报:工程技术版》
  • 主管单位:江苏教育厅
  • 主办单位:南京师范大学
  • 主编:田立新
  • 地址:南京宁海路122号
  • 邮编:210097
  • 邮箱:gkxb@njnu.edu.cn
  • 电话:025-83598631
  • 国际标准刊号:ISSN:1672-1292
  • 国内统一刊号:ISSN:32-1684/T
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国剑桥科学文摘
  • 被引量:2371