2019浙江大学可视化暑期学校-第七天

课程: 时间数据可视化
讲师: 吴向阳
讲师简介: 杭州电子科技大学计算机学院副教授,硕导。研究兴趣是数据可视化与可视分析。

课程简介: 时间是一个非常重要的维度和属性,随时间变化、带有时间属性的数据称为时变数据。处理时变数据的方法有时候与顺序型有相似之处。

1时变数据可视化

时变数据的可视化设计空间涉及三个维度,即表达、比例尺和布局。通过组合三个维度上的不同方法,就可以得到不同的时间数据可视化结果。

图1 时变型数据的可视化设计空间

(1)映射方式
老师首先列举了一些线性时间映射的实例,如下图通过线性映射方式展示一些通讯设备的价格及销售随着时间的变化趋势。

图2 线性映射

北京大学通过环形图展示了北京的交通轨迹,将时间维度延螺旋分布,据此研究城市的热点区域和市民的出行模式。

图3 交通密度绘制
图4 表格图

对于周期性时间数据,可以通过螺旋形对数据进行映射,但周期的选择是非常关键的一个因素,如图由于周期的正确选择,图所展示的模式显而易见。

图5螺旋图
任意时间线一般用于对高维数据进行降维。
图6 美国365天降水图

(2)比例尺选择
比例尺维度决定了以怎样的比例将时序数据映射到可视化中,例如线性比例尺和对数比例尺。对数比例尺一般用于时间跨度比较大,如人类历史,使用常规的线性尺无法在有限的屏幕内有效的展示。

图7 人类历史图

2多变量时间数据可视化
多变量时变型数据是实际应用中常用的数据集,由于存在多个变量,可视化需要兼顾数据本身属性和数据集的顺序性,以此来展示和挖掘顺序性数据的规律。
图8记录了学生在每周见面的数据,可以清楚的分析学生每天的活动规律,该方法将动态网络图的演变状态进行展示,没有列举每一个时间的状态网络图让人们自己去寻找发现规律,可以帮助人们了解动态网络图形的演变趋势。


图8 网络变化图

3流数据
流数据的主要特点为(1)数据可能是无限的。(2)无法知道数据的到达时间和顺序(3)实时处理(4)存在数据错误和数据丢失。吴老师详细讲解了符号累计近似(SAX),该方法将时序数据离散化,然后将离散的值分区间用字母表进行对应,就可以把一段原始数据转化为一个字符串,我们可以之后就可以利用字符串的一些算法来对时序数据进行比较,从很大程度上提高了数据计算的时间和空间复杂性。

图9 SAX
图10 LogTool

陈为老师在2017VAST上发表的E-Map,就是对社交媒体数据流进行可视化,用地图隐喻的可视化方法,来展示消息传播的变化曲线以及分析在重要事件演变过程中核心用户对它的影响。

图11 E-map

在课程的最后,老师简要的介绍了一些设计原则。简单概括就是既要尽可能多的展示数据,又要注重用户体验,使用户能够读懂图,能够从图中获取信息。


123