课程:数据释义
讲师:汤颖
讲师简介:浙江工业大学计算机科学与技术学院数字媒体技术专业系主任,副教授,硕导。研究兴趣是大数据分析与可视化。
课程简介:本次课程概要地介绍数据可视化的基本流程和核心步骤,总结基本的可视化图表映射方法,并阐述数据可视化的基本设计概念。
今天的课程内容分为三个部分:
- 可视化过程模型
- 可视编码原则
- 视觉分析模型
Part 1 三种过程模型
在第一部分中,汤教授分别介绍了三种过程模型
- 概念模型
这个模型主要讲的是原始数据经过数据分析、过滤、映射和编码的过程转换为图形式的数据的过程。
- 数据状态参考模型
数据状态参考模型,是从数据的形式来描述可视化的过程的,先从数值转变为可以理解分析的抽象数据类型,然后在进行可视化表示变为视图。
- 可视化参考模型
图五展示了又Card,Mackinlay和Shneiderman等人提出的可视化参考模型,在这样的模型和前两种的区别在于其将流程变成了回路,使得用户可以在可视化的任何阶段进行交互。
- Prefuse工具
另外,汤教授在介绍完以上三种可视化过程模型后,还介绍了一个被广泛运用的Java的可视化工具--Prefuse。
Part 2 可视编码原则
接下来是第二部分,可视编码原则。汤颖教授也从三个部分进行了讲解:
- 数据的类型
数据分为三种类型,分别为:
连续有序数据:在连续有序数据中,又可分为区间数据和比值数据,如角度、速度、百分比等
不连续有序数据:如周一、周二····,大、中、小等
分类数据:值没有顺序的数据,如男、女,苹果、香蕉、西瓜等这样的形式
- 可视编码
重要人物:Jacques Bertin,他提出了图像符号学,为可是编码奠定了理论基础
视觉编码表,在下图坐标系中,纵轴表示视觉通道(位置、大小、灰度等)横轴表示元素(如点、线、面)
在下图展示了,用颜色这种视觉通道,在不连续有序数据、连续有序数据和分类数据的编码上都可以实现。
在图11中,告诉我们,在进行视觉编码时,视觉通道的选择要和数据类型相匹配,最重要的数据属性要用最有效的视觉通道表示。
- 颜色
汤教授介绍了颜色在可视化编码中的各种用法与作用
如:颜色+亮度比单纯的用亮度能帮助人更快的找出想看到的东西。
又如:用来色来表示高亮,可以帮助人聚焦在重要数据中
Part 3 视觉分析模型
在这部分中,汤教授主要讲了可视化设计的层次嵌套模型
数据可视化等你设计简化为4个级联的层次,简单的讲,第一层是找到真实的用户问题;第二层为抽象层,讲特定的任务数据映射到抽象且通用的数据类型;第三层为编码层,设计与数据类型相匹配的视觉编码和交互方法;第四层为找到正确算法实现系统。
嵌套模型的好处是无论各层次以怎样的顺序执行,都可以独立的分析每个层次的设计是否正确合理。但嵌套模型也带来了问题:如上游的错误会级联到下游。在设计过程中,每一个层次都存在挑战,如定义了错误的问题、错误的数据抽象、低效的可视编码和低效的算法实现等。
所以,汤教授讲到,在实际的可视化设计中,需要做很多的实验,用真实的用户使用情况来反馈系统的设计是否有效。