多源规划数据获取

 

多源规划数据泛指通过非官方渠道获取的规划信息资源,包括权威部门和数据生产商等社会力量通过互联网公开发布的开放数据,以移动互联网和传感器网络为载体的社会化数据等。多源规划数据获取的实现是切实拓宽数据获取渠道,打通数据瓶颈,丰富规划资源的有效方法和有益尝试。 

多源规划数据获取的途径主要基于互联网。以城乡规划空间数据资源体系内容框架为引导,分析和评估互联网信息资源可用度,明确各类数据的获取途径。如空间位置地理信息数据来源于百度地图、谷歌地图、MapBar等网站;企业法人信息主要来源于阿里巴巴企业网、新浪企业黄页板块;社会活动信息数据来源于微博数据,如新浪微博等。多源规划数据获取的技术方法是以网络爬虫技术为核心,依托火车头数据采集平台实现数据抓取。网络爬虫是一个自动提取网页的程序,为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。多源数据获取成果一般是记录空间信息和专题属性信息的表格。后续还需跟进地址匹配、数据清洗、属性整理等一系列工作,保证多源数据科学合理地融入城乡规划综合数据库的建设与管理中。