关键技术

 

数据只有被有效利用和合理共享才能实现其最大价值。如何运用信息技术手段,最大限度地撬动数据的力量,是数据分析关键技术研究的核心关注点。北京规划院的探索主要体现在数据可视化、多维度空间分析、遥感智能识别、规划决策支持、大数据挖掘等几个方面。

首先需要采用有针对性的数据可视化技术(Information Data Visualization)实现对非空间数据直观高效的表达。常见的数据形式,从单纯的数值、二维表格、到复杂的层级结构,以及关联关系型数据,大多是单调乏味的。但随着数据内在关系复杂度以及数据量的不断攀升,数据的语言变得丰富多彩。数据可视化是一种将数据转换为便于理解和使用的图形、符号、色彩、纹理等元素的艺术和技术,其目的是增强数据识别效率,传递有效信息。北规院的实践从单纯利用Excel完成简单的柱图、饼图、折线图,渐渐发展到针对数据的特性和维度,综合使用TableauCircosMany EyesD3.jsSplunkRGephi等主流数据可视化工具,极大的提高了数据表达和决策的效率。

针对空间数据则需要基于空间分析技术(Spatial Analyst)实现对多维度、多尺度、多时相的城乡规划数据的综合分析。空间分析是为了解决地理空间问题而进行的数据分析与数据挖掘,是从一个或多个空间数据的空间关系中获取派生信息和新知识的过程,是通过空间数据和空间模型的联合作用来挖掘空间目标的潜在信息。常见的空间分析如空间信息分类、叠加分析、网络分析、邻域分析、地理统计分析等在ArcGIS软件中有完美的实现,在大量的城市规划研究中发挥了重要的作用。另外还有一系列适应地理空间数据高性能计算的模型和方法,如元胞自动机、遗传算法等,需要在规划决策支持系统中解决。

针对遥感影像数据则需要引入遥感图像自动识别技术(Automatically Information Extraction from Remote Sensing Image)实现对地球表面及其环境在遥感图像上的信息进行属性的智能识别和分类。为了提高遥感影像解译的效率和精度,北规院相继开展了《基于高分辨率遥感影像的城市用地信息提取方法研究》、《基于夜间微光遥感技术的建成区界定新方法》、《基于遥感影像解译城乡规划用地的标准研究》等一系列课题研究,解决了部分遥感在城市规划中应用的不足,如社会属性难以判别,人工目视解译强度大效率低等,切实提升了遥感资料在城乡规划中的可利用性。

规划决策支持系统(Planning Support SystemHarris 1989)是一种合适的模式,能将一系列计算机为基础的方法、模型组合为一个综合系统,使之能够支持空间规划功能。规划决策支持系统将GIS、模型、可视化功能组合起来,在规划过程中收集、组织、分析和交流信息。规划决策支持已经被公认为是在快速发展的城市化进程中社会经济和城乡建设的必然要求。在此背景下,北规院开展了《规划支持系统框架体系及典型应用研究》,通过面向我国城乡规划完整的内容体系,以北京城乡规划编制体系为例,建立与之相关联的规划支持系统框架体系,并深入研究不同层面不同类别规划编制要求(含技术标准),提出不同阶段辅助规划分析与决策的技术方法,从而不仅完善了规划支持系统基础理论,而且提出了规划支持系统建设实施策略,重点研发了规划支持系统平台,从理论体系、实施策略、应用工具等多方面实现了规划支持系统和实际业务工作的有效对接。 

大数据从数据类型、结构、量级、更新速度上呈现出的多样性和复杂性,都有别于传统意义的小数据。因此大数据从采集、导入和预处理、统计和分析,到最终数据挖掘处处存在特异性。大数据的采集特点是并发数高,例如公交IC卡刷卡记录,因此采集端需要部署大量数据库,并深入设计负载均衡和分片。大数据导入和预处理、统计和分析的难点在于数据量巨大。普通分析和分类汇总需要OracleExadataMySQL的列式存储Infobright等,而批处理或者基于板结构化数据的需求则应该使用Hadoop。大数据挖掘的挑战是挖掘的算法复杂,并且涉及数据量和计算量都非常大。比较典型的算法如用于聚类的K-Means、用于统计学习的SVM,和用于分类的Naïve Bayes,主要使用的工具有HadoopMahout等。目前北规院对大数据的相关技术研究尚处摸索阶段。