随着数据采集和处理技术的进步,在经济、军事、物流、金融、电信等领域的具体应用中,数据的不确定性普遍存在.不确定性数据的表现形式多种多样,它们可以以关系型数据、半结构化数据、流数据或移动对象数据等形式出现.针对信息抽取过程中的不确定性数据,基于半条件随机场(semi-Markov Conditional Random Fields,semi-CRFs)模型,构建支持不确定数据Top-k查询的信息抽取框架.建立基于关系的不确定性数据描述方法和存储模式,提出一种基于概率框架下的面向不确定性数据的Top-k查询算法.实验证明,该框架在提高数据元素属性标注性能的同时,在Top-k查询方面也具有有效的查询响应性能.
随着数据采集和处理技术的进步,在经济、军事、物流、金融、电信等领域的具体应用中,数据的不确定性普遍存在.不确定性数据的表现形式多种多样,它们可以以关系型数据、半结构化数据、流数据或移动对象数据等形式出现.针对信息抽取过程中的不确定性数据,基于半条件随机场(semi-Markov Conditional Random Fields,semi-CRFs)模型,构建支持不确定数据Top-k查询的信息抽取框架.建立基于关系的不确定性数据描述方法和存储模式,提出一种基于概率框架下的面向不确定性数据的Top-k查询算法.实验证明,该框架在提高数据元素属性标注性能的同时,在Top-k查询方面也具有有效的查询响应性能.