2020浙江大学可视化暑期学校-第一天

课程: 可视化释义
讲师: 屈华民
讲师简介: 现任香港科技大学计算机与工程系正教授及学校跨学科课程事务处主任。本科毕业于西安交通大学数学系,2004年于纽约州立大学石溪分校取得计算机博士学位。研究领域是数据可视化和人机交互,主要的研究方向是可解释性AI,智慧城市、社交网络分析、数位学习和文本可视化。
课程简介: 本次讲座主要介绍与可视化相关的一些问题:什么是数据可视化?为什么需要数据可视化?什么是好的数据可视化?在解读这些问题的同时介绍数据可视化的历史,数据可视化的主要设计和工作流程,以及数据可视化和数据挖掘、人机交互、人工智能之间的关系。最后,本次讲座采用一些实际案例具体展示数据可视化的重要应用。

1 什么是可视化

屈老师用特朗普大选和家庭买房能力的可视化实例介绍了什么是可视化;
可视化可以简明地定义为”通过可视化表达增强人们完成某些任务地效率“
数据可视化的输入是数据(data),输出是可视化形式(visual form),目标是发现见解(insight)

图1 什么是可视化
2 为什么需要数据可视化

屈老师用数3和四个二维数据点集的例子解释了我们为什么需要数据可视化;

人的视觉系统相当于一个小的并行机,通过视觉通道(visual channel)可以将多种信息同时输入大脑,提高处理效率;
数据可视化的作用就在于视物致知。对于复杂、大尺度的数据,已有的统计分析或数据挖掘方法往往是对数据的简化和抽象,隐藏了数据集真实的结构,而数据可视化则可还原乃至增强数据中全局结构和具体细节。

3 什么是好的数据可视化

屈老师借用《天演论》中的信达雅来作为可视化的标准。

  • 信(Accuracy):即真实性,指是否正确地反映了数据的本质,以及对所反映的事物和规律有无正确的感受和认识;
  • 达(Intuitiveness,Efficiency and Effectiveness):即有效性,指能否直观、高效地帮助完成任务;
  • 雅(Aesthetic):即美观性,可视化是艺术与技术结合的一门学科,简洁和美观都是应该追求的目标;
4 数据可视化基本流程

屈老师用一张图解释了最新的结合AI的数据可视化流程,并且与之前的可视化流程作了比较。

图2 可视化的基本流程
5 数据可视化与其他领域的关系
图3 可视化与其他领域的关系
  • 数据可视化与信息图的关系

信息图是静态的,而数据可视化是可以交互的;

  • 数据可视化与人机交互

数据可视化是处理数据,而人机交互包含任何人与计算机进行交互的场景,二者存在交叉;

  • 数据可视化与数据挖掘

数据挖掘关注的是自动算法,把人的工作排除在外;而可视化一定需要人来交互;
所以在数据分析过程中,要让机器和人分别做好自己的本职工作;

6 新的商业机会

  • 普适的数据可视分析系统(对标Tableau和PowerBI)
  • 垂直领域的可视分析系统(智能制造,Fintech)
  • 大屏展示系统
  • 数据动画
  • 5G时代:VR+VIS
  • 电子教育

最后,屈老师对同学们的问题进行答疑,并总结了目前可视化新的商业机会!