2018浙江大学可视化暑期学校-第十天

课程:Visual Analytics of Multidimensional Data
讲师:Yingcai Wu
讲师简介:
巫英才,浙江大学CAD&CG国家重点实验室,浙江大学百人计划研究员。他于香港科技大学获得博士学位。在担任现职之前,巫英才于2012年至2015年期间担任微软亚洲研究院研究员,2010年至2012年担任加州大学戴维斯分校博士后研究员。他的主要研究方向为视觉分析,信息可视化与人机交互。他发表了50多篇论文,他的三篇论文在IEEE VIS 2009,IEEE VIS 2014和IEEE PacificVis 2016上获得了荣誉奖。
课程简介
wuyingcai

图1 Yingcai Wu:Visual Analytics of Multidimensional Data

1.数据降维

(1)PCA(Principal Component Analysis)
主成分分析(PCA)的目的是寻找在最小均方意义下最能代表原始数据的投影方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。

pca

图2 PCA

从几何上来说,所有样本点在特征空间中形成了椭球形状的云团,主成分分析则是通过提取云团散布的最大方向的方法,实现了特征空间的降维。

(2)MDS(Multidimensional Scaling)
MDS输入的数据点间的相似度矩阵。MDS算法试图找到一个特征子空间,在这个特征子空间中,样本彼此之间的相似度被尽可能地保留。

2.高维数据可视化方法
高维数据可视化方法主要有以下4种:
(1)scatter-plot matrix
scatterpm

图3 scatter-plot matrix

(2)parallel coordinates
parallelcor

图4 parallel coordinates

(3)glyph-based methods
glyphbased

图5 glyph-based methods

(4)small multiples
smallmultiples

图6 small multiples

3.城市数据可视化
城市数据可视化主要包含三种类型:时间可视化、空间可视化、时空可视化。
(1)时间可视化
temporal

图7 时间可视化的多种实现方法

(2)空间可视化
空间可视化主要包含三种类型:

pointvis

图8 基于点的可视化

region

图9 基于区域的可视化

linevis

图10 基于线的可视化

(3)时空可视化

timespace

图11 时空可视化