2017浙江大学可视化夏令营第三天

今天是浙大可视化与可视分析博士生学术论坛的第三天。上午第一节课是来自浙江工业大学的孙国道老师带来的“城市数据可视化”,孙国道老师首先对城市数据可视化进行了简介:例如交通数据,用户行为数据,环境数据,经济数据等等,其具有高度异构,高维度,高动态(产生速度非常快),冗余与稀疏并存,不确定性(位置缺失,地理位置偏移)以及非结构性的特点,再者讲了城市数据可视化面临的两个挑战:
1)数据需要大量的数据清洗,并且存在时空可视探索和专家需求和可视设计的结合问题;
2)如何解读可视化,并将其转化为知识。紧接着向我们介绍了城市数据的可视化方法,分别是时间数据可视化、空间数据可视化和时空数据可视化。并且孙国道老师通过城市交通数据可视化、城市环境数据可视化等四个案例让我们对城市数据可视化有了更深刻的认识。

1

孙国道老师授课

上午紧接着是中南大学夏佳志老师的“高维数据可视化”课程,夏佳志老师按照信息可视化流程,介绍了高维数据可视化的两个关键步骤:可视映射与数据转换。其中可视映射主要介绍了三种方法:
1)基于坐标轴的方法(见下图基于坐标轴的方法):散点矩阵,平行坐标,平行集,星形图,雷达图;
2)基于图标的方法(见下图基于图标的方法):星形图,脸谱图,small multiples,其中small multiples是一种图标的排列方法,它是将高维数据的多个视图按一定的顺序摆放在一个视图中,昨日鲁爱东老师也曾提到过;
3)基于像素图的方法(见下图基于像素图的方法):像素柱状图,马赛克图,像素图。

2

基于坐标轴的方法

3

基于图标的方法

4

基于像素图的方法

数据转换则是以任务为导向的,夏佳志老师主要介绍了降维与低维表达方法(见下图数据转换方法)。最后展望部分夏佳志老师提到:高维数据可视化是信息可视化中的标志性事件,从过去几年的发展状况来说,它的分析任务更明确,指导信息更充分,强调数据预审查,并且数据规模巨大,这也是大数据分析的必然需求。

5

数据转换方法

午饭过后我们有幸参观了陈为老师实验室的大屏实验环境,不得不说,借助于大屏幕显示区域大的优势,使得可视化能够展现更多的信息,也更利于用户综合更多的信息去解决特定问题。当然,大屏幕带来的最为直接的是强烈的视觉冲击,尤其是陈为老师实验室的地球大气模拟的工作,在大屏上的优势尤为明显。

6-3

浙大大屏实验环境

下午的首场课程是由浙江大学的陶煜波老师带来的“科学计算可视化”,陶煜波老师主要从科学计算可视化的基础与概念、标量场数据可视化方法与实例、向量场数据可视化方法与实例、多变量数据分析方法与实例四个方面对科学计算可视化进行了介绍。

7

陶煜波老师授课

在基础与概念部分,陶煜波老师主要介绍了科学计算可视化、空间数据分类和科学计算可视化应用领域等内容。紧接着陶煜波老师给我们介绍了四类标量场数据可视化方法:1)标量场数据可视化过程;2)二维标量场可视化;3)三维标量场可视化;4)体绘制积分 – 数值实现,并用实例进行了解释。在课程的最后,陶煜波老师分享了诸多科学计算可视化工具(见下图)。

8

科学计算可视化工具

下午的第二位老师是中南大学信息科学与工程学院的赵颖老师,课程的主题为“网络安全数据可视化”。赵颖老师总共介绍了四部分内容:网络安全数据可视化概述,技术与应用,实战案例详细分解以及总结和实战资源分享。

9

赵颖老师授课

首先赵老师提到网络安全数据主要分为四类:流量监控,状态监控,事件监控以及系统配置文件等数据,因为其数据量大且异构,误报和漏报多,并且人在安全威胁评估和决策执行中占主导地位,所以采用可视化进行网络安全数据分析。
  在网络安全数据可视化技术与应用中,首先介绍了网络安全常用的技术与应用(见下图),然后通过多空间协同的网络异常定位的实例说明可视化在网络监控与异常检测的优势。最后通过三个实例分别介绍了可视化在网络攻击特征分析,网络攻击关联分析以及网络安全态势感知的应用。

10

网络安全常用的技术与应用

在实战案例方面,赵老师以2014年VAST Challenge MC3为例,详细介绍了如何进行顶层设计,可视化设计以及结果分析。他特别指出,类似的竞赛适合可视分析入门与进阶实践,而且数据分析与可视分析是密不可分,互为补充的,网络安全知识在整个分析过程中也起着主导作用。

本日最后的环节是博士生论文报告,首先作报告的是替因故未到场的学生做报告夏佳志老师。文章标题是:LDSScanner: Exploratory Analysis of Low-Dimensional Structures in High-Dimensional Datasets,文章的主要工作专注于高维数据中低维结构的探索分析。在特征的选择方面,作者采用局部切空间,局部切空间差异等特征,特别设计LTSD-GD视图,将MDS投影至x轴,并对投影方法做了修改,为展示局部子空间的差异,并通过实验验证了LTSD-GD视图的有效性。最后通过几个不同的数据集实例,并与LDA,t-SNE,ISOMAP进行对比,验证了所提出方法的有效性。

11

夏佳志老师分享论文

第二场是王叙萌博士的工作: A Utility-aware Visual Approach for Anonymizing Multi-attribute Tabular Data,文中设计了一个在考虑实用性的情况下对数据进行保护的可视化系统,采用了语义匿名模型,差分隐私模型以及实用性测量模型,系统主要包括两个主视图,分别是PER-tree隐私暴露风险树视图与实用性度量矩阵视图,系统的主要流程主要是将数据导入数据库,构建PER-tree隐私暴露风险树,观察和调整树中层级顺序,验证实用性(通过实用性度量矩阵视图反应实用性实时波动),导出数据,最后通过家庭收入和保险调查数据的case study验证系统的有效性。

12

王叙萌博士分享论文

最后是由兰吉博士的工作:乒乓球数据分析,文章通过数据可视化可以对数据进行纵览,发现有意义的模式。主要进行时序统计战术信息分析以及跨视图分析,系统主要分为四个部分,分别展示纵览时序信息的场视图,展示具体详细信息的拍细节视图,展示统计信息的统计视图,展示战术信息的战术视图,最后通过拿捏正反手击球技术数据分析了选手所采用的战术特点,验证了系统的有效性。

13

兰吉萌博士分享论文

最后是由兰吉博士的工作:乒乓球数据分析,文章通过数据可视化可以对数据进行纵览,发现有意义的模式。主要进行时序统计战术信息分析以及跨视图分析,系统主要分为四个部分,分别展示纵览时序信息的场视图,展示具体详细信息的拍细节视图,展示统计信息的统计视图,展示战术信息的战术视图,最后通过拿捏正反手击球技术数据分析了选手所采用的战术特点,验证了系统的有效性。

以上所分享的三篇论文都已被TVCG收录,衷心感谢今日老师和师兄师姐们的精彩课程和报告。