2019浙江大学可视化暑期学校-第三天

课程:数据释义
讲师:汤颖
讲师简介:浙江工业大学计算机科学与技术学院数字媒体技术专业系主任,副教授,硕导。研究兴趣是大数据分析与可视化。
课程简介:本次课程概要地介绍数据可视化的基本流程和核心步骤,总结基本的可视化图表映射方法,并阐述数据可视化的基本设计概念。

-----2019-07-12---6.41.20

图1 汤颖教授在讲课

今天的课程内容分为三个部分:

  1. 可视化过程模型
  2. 可视编码原则
  3. 视觉分析模型

---1-1

图2 大纲

Part 1 三种过程模型

在第一部分中,汤教授分别介绍了三种过程模型

  1. 概念模型
    这个模型主要讲的是原始数据经过数据分析、过滤、映射和编码的过程转换为图形式的数据的过程。

---2-1

图3 概念模型
  1. 数据状态参考模型
    数据状态参考模型,是从数据的形式来描述可视化的过程的,先从数值转变为可以理解分析的抽象数据类型,然后在进行可视化表示变为视图。

---3

图4 数据状态参考模型
  1. 可视化参考模型
    图五展示了又Card,Mackinlay和Shneiderman等人提出的可视化参考模型,在这样的模型和前两种的区别在于其将流程变成了回路,使得用户可以在可视化的任何阶段进行交互。

---4

图5 可视化参考模型
  1. Prefuse工具
    另外,汤教授在介绍完以上三种可视化过程模型后,还介绍了一个被广泛运用的Java的可视化工具--Prefuse。

---5

图6 Prefuse

Part 2 可视编码原则

接下来是第二部分,可视编码原则。汤颖教授也从三个部分进行了讲解:

  1. 数据的类型

数据分为三种类型,分别为:
连续有序数据:在连续有序数据中,又可分为区间数据比值数据,如角度、速度、百分比等
不连续有序数据:如周一、周二····,大、中、小等
分类数据:值没有顺序的数据,如男、女,苹果、香蕉、西瓜等这样的形式

-----2019-07-12---8.09.38

图7 数据类型
  1. 可视编码

重要人物:Jacques Bertin,他提出了图像符号学,为可是编码奠定了理论基础

---16png

图8 Jacques Bertin

视觉编码表,在下图坐标系中,纵轴表示视觉通道(位置、大小、灰度等)横轴表示元素(如点、线、面)

---8

图9 视觉编码表

在下图展示了,用颜色这种视觉通道,在不连续有序数据、连续有序数据和分类数据的编码上都可以实现。

---9

图10 颜色

在图11中,告诉我们,在进行视觉编码时,视觉通道的选择要和数据类型相匹配,最重要的数据属性要用最有效的视觉通道表示。

---10

图11 表示类型与有效性排名
  1. 颜色

汤教授介绍了颜色在可视化编码中的各种用法与作用

如:颜色+亮度比单纯的用亮度能帮助人更快的找出想看到的东西。

-----2019-07-12---8.25.53

图12 Pop-Out

又如:用来色来表示高亮,可以帮助人聚焦在重要数据中

-----2019-07-12---8.28.15

图13 Highlighting

Part 3 视觉分析模型

在这部分中,汤教授主要讲了可视化设计的层次嵌套模型
数据可视化等你设计简化为4个级联的层次,简单的讲,第一层是找到真实的用户问题;第二层为抽象层,讲特定的任务数据映射到抽象且通用的数据类型;第三层为编码层,设计与数据类型相匹配的视觉编码和交互方法;第四层为找到正确算法实现系统。
嵌套模型的好处是无论各层次以怎样的顺序执行,都可以独立的分析每个层次的设计是否正确合理。但嵌套模型也带来了问题:如上游的错误会级联到下游。在设计过程中,每一个层次都存在挑战,如定义了错误的问题、错误的数据抽象、低效的可视编码和低效的算法实现等。
所以,汤教授讲到,在实际的可视化设计中,需要做很多的实验,用真实的用户使用情况来反馈系统的设计是否有效。

---11

图14 嵌套模型