位置:成果数据库 > 期刊 > 期刊详情页
基于XML/Schema甲骨文语料库语料标注的研究
  • ISSN号:1671-1815
  • 期刊名称:《科学技术与工程》
  • 时间:0
  • 分类:TP311.12[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]安阳师范学院计算机与信息工程学院,安阳455000
  • 相关基金:国家自然科学基金(60875081)资助
中文摘要:

对语料库进行语料标注是实现原始语料信息计算机可读的关键。采用XML+XMLSchema对甲骨文语料库进行结构化标注,使不同类型的数据表示成统一的格式,方便数据的交换与共享。给出了一种依据XML文档中使用的词汇集,对词汇集进行建模来约束XML文档中使用的元素和属性及其之间的结构关系和数据类型。根据定义好的XMLSchema使用XML对甲骨文信息进行结构化标注,可以准确地描述数据的结构及数据类型。

英文摘要:

It is the key of realizing original computer-readable information to tag the corpus . Using XML + XML schema to oracle corpus tagging structured , so that different types of data into a uniform format to facilitate da- ta exchange and sharing, a Document based on the use of XML vocabulary sets, modeling of vocabulary sets to constrain the use of XML document elements, attributes, their structural relationship between and data types. According to the defined XML schema to oracle XML structured information tagging, the data structure and data types can be deseribed accuratly.

同期刊论文项目
期刊论文 26 会议论文 16 获奖 2
同项目期刊论文
期刊信息
  • 《科学技术与工程》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国技术经济学会
  • 主编:明廷华
  • 地址:北京市学院南路86号
  • 邮编:100081
  • 邮箱:ste@periodicals.net.cn
  • 电话:010-62118920
  • 国际标准刊号:ISSN:1671-1815
  • 国内统一刊号:ISSN:11-4688/T
  • 邮发代号:2-734
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国科技核心期刊,中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:29478