2018年春季学期视觉计算实验室第15周论文研读预告

时间:2018年06月14日 09:30
地点:望江基础教学楼B座318实验室
研读成员:夏婷
研读内容:
Andrienko G, Andrienko N, Fuchs G, et al. Revealing Patterns and Trends of Mass Mobility through Spatial and Temporal Abstraction of Origin-Destination Movement Data[J]. IEEE Transactions on Visualization & Computer Graphics, 2017, 23(9):2120-2136.
论文简介:
本文研究的是时变数据OD流,即流数据的可视化分析。就国内外的研究现状,主要是将许多人的个体OD按照时间间隔聚集成流来研究群体迁移的时空模式和趋势,因此本文在此基础上开发了一个分析流时空特征的通用程序。针对OD流可视化的研究,可视化针对时变数据流主要面临两大难题:1)由于任意位置的流可以相互连接,因此会导致形成许多边缘交叉点的图形,造成视觉混淆;2)需要分析由许多空间情况组成的长时间序列(即未经过时间间隔划分,并且具备多种流方向和距离范围)。本文提出一种通过空间和时间抽象来促进流数据探索的方法,允许通过图表映射代替流图来表示空间情况,从而减少流图的交叉点和遮挡。聚类结果的时间和空间显示有助于发现群体迁移行为的周期模式和长期的趋势。
大规模迁移数据通常具有高纬度、高复杂性及大数据的特征,所以从未经过处理的数据中很难分析和理解大规模迁移行为的时空模式和长期趋势。OD流通常指的是移动记录,包括起点、目的地、开始时间和结束时间。这样的记录可以通过初始目标和时间间隔聚集成流。流的特征指的是移动物体的数量等等,比如移动的平均时间、速度。因为流的复杂度是可能的源-目的地对数量的乘积,因此需要先抽象流数据,降低复杂度来理解大规模的迁移运动。
针对上述原因,本文的降维方法:空间抽象是通过方向和距离范围聚类具有共同起源或共同目的地的OD流;时间抽象是通过流的相似性基于时间间隔的聚类。本文的主要贡献为整个分析过程:1)空间的简化和分析,a)将OD流按照方向和距离范围聚合来简化流动情况。b)通过一组径向图表示地图上的抽象流动情况的可视化方法。b)支持流情况之间可视化比较的方法。c)将空间情况的整体抽象视图与“细节”相结合的方法;2)时间简化与分析,a)根据数据流的相似度聚类进行数据抽象。b)日历图可视化显示流聚集流动情况的总体时间分布;3)时间模式,相似流通过时间间隔聚集,流或大或小变化,连续性中断的情况;4)空间模式,集线器(具有许多流入或者流出流的位置探索)、空间流动趋势、吸引和排斥的区域;5)变化的空间模式,流入和流出流增加或者减少的位置和区域,以及关于流动方向/距离的变
1-9

图 1 提出的分析工作流
着重关注本文中流图的设计,图2-2为流图设计变型,主要有五种图形。列标签表示形状:p-多边形,b-bar,R-玫瑰,A-角,C-圆。行标签表示组合组件的方法:O覆盖、J并列、S分割。所有图表都表示相同的值组合。除了CJ以外的所有设计中,颜色被用来区分距离范围。深灰色代表往返,从黄色到橙色到红色的颜色对应短、中、长距离,这种颜色比例设计基于颜色布鲁尔方式。
2-3

图 2 交通数据可视化的思维导图
为了更好的对比图中的组件和基于地图可视化效果,选择非相邻的元素并且增加所选颜色的亮度,如图2-3所示。通过色调表示距离类别可以支持地图的整体视图,视觉变量“颜色”(色调)是选择性和关联的,地图查看器可以选择并关联同一颜色的所有可视化标记。
3

图 3 不同的图表设计表示相同数据的片段
4

图 4 时间集群2的流出和流入(夏季工作日早晨)
在两个协调地图上显示,通过相同的时间间隔或事件群集来表现差异性
本文以伦敦公共自行车数据为例,由伦敦政府交通管理局公开提供-(http://www.tfl.gov.uk/info-for/open-data-users/our-feeds),使用的LCHS主要数据集包括了5177679条记录,有569个直行车站点,在站之间的流动中的个体行程聚集导致具有218187个链接图。同时为了证明程序的通用性,用米兰的17241辆车辆的轨迹证实其有效性。图2-5为根据自行车数据的时间和流量集群(周末中午),根据流入流出分析出现这种情况的原因,比如人们出行习惯、天气因素等等,图2-6为时间集群前提下的OD流流量的变化,绿色表示负的差异,即减少的流量,红的则相反。作者的意图不仅要发现已有的周期模式规律-即检测到预期,同时也要揭开意外,发现潜在的信息。
5

图 5 自行车数据流入流出对比图
6

图 6 米兰车辆数据时间集群变化OD流量-差异图
综上,文章介绍了几种表示OD流量的可视化图,将其映射到地图,并且可以在多张地图上比较在同一个时间/空间聚集情况下的差异性,分析导致差异的原因。同时用户可以自主选择地图上的包含了流图的区域,有针对性的分析某个区域的OD情况。文章存在的不足之处:1)空间简化的缺点,由于流的方向和聚集的聚集,从而形成了离散类,不同的流可能会出现在同一个类,并且没有区分度;2)失去位置之间的链接。

123