东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于属性权重的实体解析技术

ISSN号：1000-1239
期刊名称：计算机研究与发展
时间：2013
页码：281-289
分类：TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]东北大学信息科学与工程学院
相关基金：国家自然科学基金项目(61272178,61173031);国家自然科学基金海外及港澳学者合作基金项目(61129002);教育部高等学校博士学科点专项科研基金项目(2011004211028);中央高校基本科研业务费专项资金项目(N120504001,N110404015)
相关项目：面向多源信息的实体分析与识别技术

作者：甑灵敏|杨晓春|王斌|Ahemd A Hussein|

关键词：实体解析, 属性权重, 信息增益, 实体识别, TOP-K

中文摘要：

实体解析是将在同一个数据源或者不同数据源中,指向现实世界同一实体的元组识别出来并合并的过程.如何高效而准确地将指向同一实体的记录识别出来一直是研究人员不懈追求的目标.在基于规则的匹配算法中,大多数算法是将所有的属性都作为匹配属性进行计算,并且各个属性的权重都是一样的,然而这样不能充分体现关键属性的重要性.主要针对关系数据库数据源中实体解析准确性的问题,采用信息增益的方法和概率统计的方法计算数据属性的权重,用来代表该属性在记录中的重要性,达到提高实体解析准确度的目的.并且在此基础上采用top-k算法,选择出最佳分类属性集合,减少匹配属性的个数,从而加快了实体解析的速度.

同期刊论文项目

面向多源信息的实体分析与识别技术

期刊论文 31 会议论文 20 获奖 2

社会网络中多元约束条件下的隐私保护关键技术研究

期刊论文 25 会议论文 13 获奖 3

支持跨模型多源数据的复制检测关键技术研究

期刊论文 14

同项目期刊论文

基于图自同构的K-Secure社会网络隐私保护方法

防止路径攻击的加权社会网络匿名化技术

基于 Grid 网格划分的改进路网最短路径查询

一种支持约束关系的高效的行程规划算法

障碍空间中保持位置隐私的最近邻查询方法

社会网络数据发布隐私保护技术综述

基于位置的社会网路的K-连接安全分组匿名方法

基于Grid网格划分的改进路网最短路径查询

大数据环境下支持概率数据范围查询索引的研究

路网环境下基于位置服务的隐私保护方法

增量的动态社会网络匿名化技术

Obtaining k-obfuscation for profile privacy in social network

A secure K-automorphism Privacy Preserving Approach with High Data Utility in Social Networks

基于外存后缀树的top-k局部比对算法

基于时间约束的人气最优路径搜索

支持动态图数据的子图查询方法

基于变化的服务演化一致性判定

一种支持约束关系的高效的行程规划算法

海洋多模态数据世系原型系统

基于缓存技术的路网最短路径查询

障碍空间中保持位置隐私的最近邻查询方法

社会网络数据发布隐私保护技术综述

大数据环境下支持概率数据范围查询索引的研究

路网环境下基于位置服务的隐私保护方法

增量的动态社会网络匿名化技术

面向压缩生物基因数据的高效的查询方法

一种空间高效的多核并行近似子串匹配方法

Approximate Continuous Top-k Query over Sliding Window

Memory-Aware BWT by Segmenting Sequences to Support Subsequence Search

基于变化的服务演化一致性判定

最小化解释Why-Not问题

一种支持约束关系的高效的行程规划算法

Detecting Copy Directions among Programs Using Extreme Learning Machines

一种空间高效的多核并行近似子串匹配算法

海洋多模态数据世系原型系统

基于缓存技术的路网最短路径查询

Negative Factor: Improving Regular-Expression Matching in Strings

障碍空间中保持位置隐私的最近邻查询方法

大数据环境下支持概率数据范围查询索引的研究

路网环境下基于位置服务的隐私保护方法

增量的动态社会网络匿名化技术

基于外存后缀树的top-k局部比对算法

基于时间约束的人气最优路径搜索

一种空间高效的多核并行近似子串匹配方法

期刊信息

《计算机研究与发展》
中国科技核心期刊

主管单位:中国科学院
主办单位:中国科学院计算技术研究所
主编：徐志伟
地址：北京市科学院南路6号中科院计算所
邮编：100190
邮箱：crad@ict.ac.cn
电话：010-62620696 62600350

国际标准刊号：ISSN：1000-1239
国内统一刊号：ISSN：11-1777/TP
邮发代号:2-654

获奖情况:
2001-2007百种中国杰出学术期刊，2008中国精品科...,中国期刊方阵“双效”期刊

国内外数据库收录:
俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:40349