基于人工方式构建中文地名词典,耗时长、地名数目规模受限,无法满足Web环境下地理信息获取服务对地名的需求。本项目研究面向Web的中文模糊地名自动识别与近似地理范围估算,利用面向地名主题信息的协同聚焦爬取方法,从多源海量Web信息中爬取模糊地名及关联地名网页信息,进一步利用规则与统计相结合的模糊中文地名分级识别策略,有效的提取模糊地名及其关联地名信息,最终基于空间扫描统计的方法完成模糊地名近似地理覆盖范围估算。本项目研究Web环境下地名自动获取的新问题,其成果可应用各类网络空间信息系统,具有重要的理论研究价值与应用前景。
英文主题词toponym;recognition;geographical coverage;;