位置:成果数据库 > 期刊 > 期刊详情页
基于云计算面向网络舆情的Deep Web数据抽取关键技术研究
  • ISSN号:1009-3044
  • 期刊名称:《电脑知识与技术:学术交流》
  • 时间:0
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:南通大学现代教育技术中心, 南通大学交通学院
  • 相关基金:2014南通市科技课题“基于云计算面向网络舆情的Deep Web数据抽取关键技术研究”课题编号:BK2014054的研究成果;南通市科技平台计划“南通市高性能计算重点实验室”(项目编号CP2013001);国家自然科学基金“面向Web的大规模社会网络数据提取理论与方法研究”(项目编号61171132)
中文摘要:

就当前舆情信息数据的海量性和数据源展现的不可预见性,对Html页面进行降噪、子树构建,通过相似度计算和舆情简易本题库的引入完成数据块识别和数据记录集抽取,最后以Hadoop平台为实验环境,对抽取出的算法进行实验,实验表明该算法在舆情数据挖掘中,对抽取规则的自动提取具有一定的参考价值。

同期刊论文项目
同项目期刊论文
期刊信息
  • 《电脑知识与技术:学术交流》
  • 主管单位:安徽出版集团有限责任公司
  • 主办单位:时代出版传媒股份有限公司 中国计算机函授学院
  • 主编:
  • 地址:安徽合肥市濉溪路333号
  • 邮编:230041
  • 邮箱:xsjl@dnzs.net.cn
  • 电话:0551-65690964 65690963
  • 国际标准刊号:ISSN:1009-3044
  • 国内统一刊号:ISSN:34-1205/TP
  • 邮发代号:26-188
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:23925