东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

K-Canopy:一种面向话题发现的快速数据切分算法

ISSN号：1671-9352
期刊名称：《山东大学学报：理学版》
时间：0
分类：TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：中国科学院网络数据科学与技术重点实验室中国科学院计算技术研究所, 中国科学院大学, 中国信息安全测评中心, 国家计算机网络与信息安全管理中心
相关基金：国家重点基础研究发展计划(973计划)项目(2012CB316303,2013CB329602);国家高技术研究发展计划(863计划)项目(2014AA15204);国家自然科学基金青年项目(61303156);国家自然科学基金重点项目(61232010);欧盟FP7-PIRSES-GA-2012-318939;中国科学院重点部署项目(KGZD-EW-T03-2)

作者：陈强, 杜攀, 陈海强, 包秀国, 刘悦, 程学旗

关键词：数据切分, 话题发现, 海量数据, 平衡能力

中文摘要：

针对海量数据上的话题发现任务,提出了一种均匀快速的数据预切分算法。在保证一定精度情况下,通过该算法可以按照数据的语义关联强度快速有效地将数据集切分成大小均匀的子数据集,以支持后续的话题发现算法的并行执行。实验表明,所提出的方法能够快速切分海量数据,保持块内数据的语义关联,大大提升话题发现的效率与质量。

同期刊论文项目

面向微博数据流的事件主线挖掘技术研究

期刊论文 2

在线社会关系网络的挖掘与分析

期刊论文 38

同项目期刊论文

基于差异合并的分布式随机梯度下降算法

面向智能搜索的动态知识网络建模

符号网络研究综述

社交网络用户在在线媒体中点播行为预测

大规模演化知识网络中的关联推理

大数据系统和分析技术综述

社交网络账号的马甲关系辨识方法

面向知识级应用的多维语义本体构建

大数据时代的个人隐私保护

基于开放网络知识的信息检索与数据挖掘

图索引技术研究综述

网络群体行为的演化博弈模型与分析方法

一种支持复杂关系查询的图存储系统

基于多策略过滤的汉日多词短语抽取和对齐

基于多视角特征融合的中文垃圾微博过滤

网络大数据:现状与展望

基于吸收态随机行走的两阶段效用性查询推荐方法

基于中文微博语料的情感倾向性分析

基于事件的新闻客户端热门评论预测框架

基于词向量的开放文本领域概念识别方法

一种面向图数据的预装载缓存策略

融合局部共现和上下文相似度的查询扩展方法

基于因果模型的主题热度计算与预测方法

一种基于网页块特征的多级网页聚类方法

基于Web的查询翻译中OOV译文挖掘优化

深度文本匹配综述

在线社会网络的动态社区发现及演化

基于情感词向量的微博情感分类

基于同义扩展的在线百科中实体属性抽取

SCMF：一种融合多源数据的软约束矩阵分解推荐算法

基于深度神经网络的中文命名实体识别

网络高流量分布式拒绝服务攻击防御机制研究综述

基于同义扩展的在线百科中实体属性抽取

期刊信息

《山东大学学报：理学版》
北大核心期刊（2011版）

主管单位:中华人民共和国教育部
主办单位:山东大学
主编：刘建亚
地址：济南市经十路17923号
邮编：250061
邮箱：xblxb@sdu.edu.cn
电话：0531-88396917

国际标准刊号：ISSN：1671-9352
国内统一刊号：ISSN：37-1389/N
邮发代号:24-222

获奖情况:

国内外数据库收录:
美国化学文摘（网络版）,美国数学评论（网络版）,波兰哥白尼索引,德国数学文摘,中国中国科技核心期刊,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,英国英国皇家化学学会文摘

被引量:6243