位置:成果数据库 > 期刊 > 期刊详情页
格网化的位置微博数据抓取与人群信息提取
  • ISSN号:1009-2307
  • 期刊名称:《测绘科学》
  • 时间:0
  • 分类:P208[天文地球—地图制图学与地理信息工程;天文地球—测绘科学与技术]
  • 作者机构:[1]陕西师范大学旅游与环境学院,西安710119, [2]中国科学院地理科学与资源研究所,北京100101, [3]资源与环境信息系统国家重点实验室,北京100101
  • 相关基金:国家自然科学基金项目(41201412,41471414);特色研究所培育建设服务项目(TSYJS03);资源与环境信息系统国家重点实验室青年人才培养基金项目(08R88640KA)
中文摘要:

空间位置信息通常代表了设备使用人群的地理空间活动特征,客观体现人群活动的时空分布。针对现有的微博数据抓取方法由于普通用户的访问限制易导致采集的目标数据缺失的问题,该文提出了一种目标区域空间划分策略。在数据抓取之前对目标区域实行格网化,进而实现数据的同时抓取。通过统计分析基于网格单元抓取的位置微博数据,从中提取出人群活动信息,结合位置微博数据所在的兴趣点类型,统计分析了位置微博用户的时空分布和活动特征。这种方法缩小了采集区域,可实现并行高效的位置微博抓取,并保证了采集范围的重叠,最大限度地保证采集数据的完整性。

英文摘要:

Spatial location information usually symbolize the geographical spatial activity features of people who use the smart mobile devices, and the features can reflect the users activity temporal and special distribution. Aiming at the problem of goal data missing caused by the restriction of common users' access of existed Microblog data fetching methods, this paper proposed a spatial partition strategy for target area. Before fetching the Microblog data, the grid transformation was carried out in the target area to realize data fetching at the same time. Through counting and analyzing the location data fetched by the grid cells, the user's activity information could be extracted from distribution trend based on different POI types. This method greatly narrowed the collection area and realized the efficient parallel of Microblog position data fetching, which ensured the overlap of collection scope and the integrity of collecting data.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《测绘科学》
  • 中国科技核心期刊
  • 主管单位:国家测绘地理信息局
  • 主办单位:中国测绘科学研究院
  • 主编:程鹏飞
  • 地址:北京市海淀区莲花池西路28号
  • 邮编:100830
  • 邮箱:niu@casm.ac.cn
  • 电话:010-63880931
  • 国际标准刊号:ISSN:1009-2307
  • 国内统一刊号:ISSN:11-4415/P
  • 邮发代号:2-945
  • 获奖情况:
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:21361