位置:成果数据库 > 期刊 > 期刊详情页
基于Web的语料自动采集技术研究
  • ISSN号:1007-9432
  • 期刊名称:《太原理工大学学报》
  • 时间:0
  • 分类:TP274[自动化与计算机技术—控制科学与工程;自动化与计算机技术—检测技术与自动化装置]
  • 作者机构:[1]太原理工大学计算机与软件学院 中国电子科技集团第三十三研究所
  • 相关基金:国家863计划资助项目(2006AA01Z142);; 国家社科基金资助项目(07CYY022)
中文摘要:

在为词典编撰进行大规模语料采集工作的背景下,以实现语料的批量自动采集为目的,介绍了基于Web的词典编撰语料自动采集技术。同时提出了该技术在图书信息领域的实验模型,图书信息搜寻系统(SearchBook v2.1.0)的设计与实现,包括如何利用搜索引擎技术及信息提取技术进行图书信息的搜索及提取。

英文摘要:

Under the aims at corpus automatic collection on the process of the large-scale Lexicography corpus collection,the paper described corpus collection technology which is based on Web.And then,the paper introduces the book information corpus tool,including how to make use of the technique of searching engine and information extraction in our system.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《太原理工大学学报》
  • 中国科技核心期刊
  • 主管单位:山西省教育厅
  • 主办单位:太原理工大学
  • 主编:黄庆学
  • 地址:太原市迎泽西大街79号
  • 邮编:030024
  • 邮箱:tyutxb@tyut.edu.cn
  • 电话:0351-6014376 6014556
  • 国际标准刊号:ISSN:1007-9432
  • 国内统一刊号:ISSN:14-1220/N
  • 邮发代号:22-27
  • 获奖情况:
  • 全国高校学报优秀期刊一等奖、二等奖,国家双效期刊奖,华北十佳期刊优秀奖,山西省一级期刊奖,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:9375