位置:成果数据库 > 期刊 > 期刊详情页
基于概率信息抽取模型的Top-k查询
  • ISSN号:1000-1239
  • 期刊名称:《计算机研究与发展》
  • 时间:0
  • 分类:TP3[自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北京工业大学计算机学院, [2]中国工商银行股份有限公司北京市分行信息科技部
  • 相关基金:国家自然科学基金项目(60803086);北京市教育委员会科技计划面上项目(200910005009,20110005013)
中文摘要:

随着数据采集和处理技术的进步,在经济、军事、物流、金融、电信等领域的具体应用中,数据的不确定性普遍存在.不确定性数据的表现形式多种多样,它们可以以关系型数据、半结构化数据、流数据或移动对象数据等形式出现.针对信息抽取过程中的不确定性数据,基于半条件随机场(semi-Markov Conditional Random Fields,semi-CRFs)模型,构建支持不确定数据Top-k查询的信息抽取框架.建立基于关系的不确定性数据描述方法和存储模式,提出一种基于概率框架下的面向不确定性数据的Top-k查询算法.实验证明,该框架在提高数据元素属性标注性能的同时,在Top-k查询方面也具有有效的查询响应性能.

英文摘要:

随着数据采集和处理技术的进步,在经济、军事、物流、金融、电信等领域的具体应用中,数据的不确定性普遍存在.不确定性数据的表现形式多种多样,它们可以以关系型数据、半结构化数据、流数据或移动对象数据等形式出现.针对信息抽取过程中的不确定性数据,基于半条件随机场(semi-Markov Conditional Random Fields,semi-CRFs)模型,构建支持不确定数据Top-k查询的信息抽取框架.建立基于关系的不确定性数据描述方法和存储模式,提出一种基于概率框架下的面向不确定性数据的Top-k查询算法.实验证明,该框架在提高数据元素属性标注性能的同时,在Top-k查询方面也具有有效的查询响应性能.

同期刊论文项目
期刊论文 19 会议论文 10
同项目期刊论文
期刊信息
  • 《计算机研究与发展》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院计算技术研究所
  • 主编:徐志伟
  • 地址:北京市科学院南路6号中科院计算所
  • 邮编:100190
  • 邮箱:crad@ict.ac.cn
  • 电话:010-62620696 62600350
  • 国际标准刊号:ISSN:1000-1239
  • 国内统一刊号:ISSN:11-1777/TP
  • 邮发代号:2-654
  • 获奖情况:
  • 2001-2007百种中国杰出学术期刊,2008中国精品科...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:40349