2020浙江大学可视化暑期学校-第六天

课程: 空间与地理数据可视化
讲师: 曾伟
讲师简介: 博士,中国科学院深圳先进技术研究院,副研究员。于2011、2015年分别获得新加坡南洋理工大学计算机专业本科和博士学位。研究领域包括可视分析、信息可视化、虚拟及增强现实、人机交互等。发表国际顶尖学术期刊和会议论文10余篇,其中包括IEEE TVCG、IEEE VIS、EuroVis、IEEE TITS、顶级期刊和会议论文。获得International Conference Information Visualisation最佳论文一次。曾任PacificVis 2019海报联合主席,IEEE T-CSS期刊客座编委,ChinaVis、IVAPP等学术会议的程序委员会委员,IEEE Vis、EuroVis、IEEE TVCG、IEEE TITS等会议和期刊的审稿人。。
课程简介: 本次课程主要从地理空间投影、地理数据可视化编码、OD线绑定和核密度技术等几个方面介绍了空间与地理数据可视化。

课程内容

1 地理数据

1.1 地理信息
  80%的数据是带有空间和地理信息的,随着gps、北斗等定位系统的普及,地理信息在我们身边有着越发广泛的应用。
  地理信息可解构为对象、位置、时间三个维度的属性,分别从这三个维度出发又有许多细分的属性。

图1.1 地理数据属性

1.2 数据的表示
  根据地理数据的性质不同,可用点、线、面三种可视化元素表征。

图1.2 地理数据表示
   
2 地图投影

  在地理可视化中,我们常需要将曲面的地理信息投影到一个平面上。
  一种常见的地图投影方法是墨卡托投影法,该方法是通过假想一个与地轴方向一致的圆柱切或割于地球,按等角条件,将经纬网投影到圆柱面上,将圆柱面展为平面后得到。它最大的优势是具有共形保角的特性,能够使投影前后的局部形状不变,但是也会扭曲实际面积。

图2.1 几种地图投影方式
 
图2.2 墨卡托投影
 

  对于地图投影,我们有四种性能评价维度,分别是共形、等面积、等距离和同方位角,但目前没有一种投影方法可以满足这四种要求,所以在实际应用中要根据需求进行取舍。

3 地理可视化的高级方法

  四种地理可视化的高级方法:几何形状(Geometry)、分级统计图(Choropleth)、比较统计图(Cartograms)和场/线方法(Fields/Lines)。
  (1)几何形状(Geometry)是指用点、线、圈等几何形状,在原本的地图图层上覆盖一层几何形状图层的可视化方法。如图3.1是芝加哥市不同种族的人口分布图,采用的就是不同颜色的点表示。

图3.1 芝加哥市不同种族的人口分布图
 

  (2)分级统计图(Choropleth)是指将部分区域用相应的色级标示来表现统计变量的方法。如图3.2是1826年新冠疫情各省分布图。由于人分辨颜色的能力有限,所以数据分级数量在五到七类为最佳。

图3.2 新冠疫情各省分布图
 

  (3)比较统计图(Cartograms)使用面积和距离进行编码。图3.3用面积大小对应人口数量的多少,制作了世界人口地图。

图3.3 世界人口地图
   
4 场/线(Fields/Lines)

4.1 密度场(Density Field)

  核密度估计(kernel density estimation)是在概率论中根据数据样本本身来估计概率密度分布的方法,可以理解为对直方图的平滑处理。图4.1展现了对航道中不同密度的映射,黄色和蓝色分别表示白天段和夜间段的数据。

图4.1 航道可视化
 

4.2 边捆绑技术(Edge bunding)
  当数据存在大量节点和边时,视觉混乱(Visual Clutter)很快成为严重的问题。因此,学术界诸多研究者设计了各种通过优化边的方式减轻上述视觉混乱,其中边绑定(Edge Bundling)方法被广泛研究和应用。
  其中,在城市交通OD数据的边绑定中,一种称为路由感知边捆绑(RAEB)的方法保留了路网的拓扑信息。

图4.2 路由感知边捆绑