作为人类最常用的空间定位方式,地名是传统地理信息系统技术通向社会化服务的关键桥梁。构建新型的地名定量化计算模型,反映地名的时空动态演化规律,有效解决地名的空间位置不确定性的表示、多歧义、语义相对性等关键性问题,为基于自然语言的地名空间认知和推理技术奠定理论基础,具有重大的科学意义和应用价值。本课题将建立基于正态分布假设的地名统计模型,研究自然环境、政治、经济、历史、文化及社会心理等多要素的地名定量化计算方法,研究地名的离散全球网格模型表达的新型数据结构,建立基于全球网格模型的地名空间认知和推理模型和方法。研究基于R树的新型三角网格三维坐标系统的空间索引方法,解决地名数据库的组织、存储、动态更新与查询方法。以北京市为研究区域构建北京市模糊地名数据库,研究地名分词和空间网络爬虫技术,构建基于空间和文本的混合索引方法,进行基于空间位置的互联网信息检索引擎原型的研究。
GIR;Place Name;Gazetteer Globle Grid System;Natural Language Understanding;Web Search Engine
作为人类最常用的空间定位方式,地名是传统地理信息系统技术通向社会化服务的关键桥梁。构建新型的地名定量化计算模型,反映地名的时空动态演化规律,有效解决地名的空间位置不确定性的表示、多歧义、语义相对性等关键性问题,为基于自然语言的地名空间认知和推理技术奠定理论基础,具有重大的科学意义和应用价值。通过本课题,建立了基于正态分布假设的地名统计模型,研究了自然环境、政治、经济、历史、文化及社会心理等多要素的地名定量化计算方法,提出了一种地名的离散全球网格模型表达的新型数据结构,建立了基于全球网格模型的地名空间认知和推理模型和方法。提出了基于R树的新型三角网格三维坐标系统的空间索引方法,设计了地名数据库的组织、存储、动态更新与查询方法。并以北京市为研究区域构建了北京市模糊地名数据库,研发了地名分词和空间网络爬虫技术,构建了基于空间和文本的混合索引方法,进行了基于空间位置的互联网信息检索引擎原型的研究。