今天是浙大可视化与可视分析博士生学术论坛的最后一天。上午第一节课,来自中国科学院软件研究所的时磊老师为我们带来了主题为“网络数据可视化与应用”的报告,主要从网络数据可视化基础和影响力图谱可视化两个方面进行介绍。
时磊老师用十个网络可视化实例,开始了今天的报告。随后详细的介绍了网络数据可视化,主流的网络可视化方法主要分为两种:适用于中小型网络的基于力导向的图布局算法和适用于大型网络的基于网络数据变换、压缩、抽样的综合可视化方法。在网络数据概念中,时老师介绍了节点,边,图布局等基本概念。网络可视化方法中有常用的节点-边可视化,也存在非节点-边的网络可视化方法,例如矩阵/节点边混合视图,树图等。网络可视化中还存在一个比较重要的问题就是大型网络可视化,因为在如今的大数据时代,网络数据正走向大型化,动态化,多样化。最后时老师推荐了一些网络可视化的软件及工具。
时磊老师报告的第二部分主要介绍了影响力图谱可视化,也就是时磊老师目前的网络可视化工作,其工作的一个创新点在于定义了影响力图谱的研究问题:影响力图谱总结以及在总结的基础上优化可视化方法(结构优化以及考虑影响力图谱时变特性),并且设计了一个EIFFEL系统,可以查看论文的影响力随时间变化的发展。
今天上午的第二位老师是来自浙江财经大学信息工程与管理学院周志光老师,其带来了主题为“地理空间数据可视化”的报告,他的报告主要分为三个部分:地理空间数据可视化简介,地理空间数据组织形式,地理空间数据可视化实例
周志光老师首先介绍了地理空间数据的基本概念,地理信息系统应用从System-Science-Service的变化,地图投影的方法以及地理数据集获取的方法,其次结合一些具体的实例介绍了地理空间数据可视化元素:点,线,区域以及立体可视化。
周老师在地理空间数据组织形式中,介绍了四种不同的可视化元素:空间多维,空间时序,空间层次以及空间稀疏。
随后,周老师介绍了三种不同领域的地理空间数据可视化案例:城市交通,自然环境以及经济贸易。在城市交通领域中,引用的是北大可视化小组所设计的南京智能交通系统,以分析和理解 城市交通运行规律,为交通部门提供决策依据;在自然环境领域中,引用的是浙江财经大学数据可视化小组设计的空气质量检测的可视化系统,用于分析城市空气污染时空特征,区域聚类及演变规律;在经济贸易领域中,介绍了一个世界各国贸易数据可视化案例,采用的是基于点的可视化方法,用于理解经济发展,地区合作和全球化进程。
最后周老师分享了两个框架,WebGL开源框架Three.js和可生成平滑动画效果的JavaScript动画库Tween.js。
今天下午,来自浙江大学CAD&CG国家重点实验室可视分析小组马昱欣博士,为我们带来了“数据挖掘释义”的分享,他的分享主要分为三个部分:数据挖掘简介,数据挖掘任务描述,数据挖掘与可视化!
马昱欣博士首先介绍了数据挖掘定义及其任务分类。在任务分类中,主要分为两类任务:描述型任务和预测性任务,描述性任务包括关联分析、聚类以及离群点分析,预测性任务包括分类与演化分析。紧接着马昱欣博士分别对这两类任务进行了详细介绍。在描述性任务中,关联分析集中于发掘频繁模式,聚类中则是要最大化类内相似性,最小化类间相似性,离群点分析的目标在于发掘罕见对象,即与数据或者模型的一般行为不一致的对象。在预测性任务中,分类是对类别未知的数据进行类别预测,演化分析主要在于时间序列的演化。在数据挖掘与可视化中,马昱欣博士提到数据挖掘与可视化的关系:可视化增强的数据挖掘方法,数据挖掘方法在可视化的应用以及预测式可视分析,并且通过一些实例帮助大家理解二者之间的关系。
最后,马昱欣博士将数据挖掘与可视化的关系总结为三句话,分析策略不同,技术方法互补,面向任务可结合。为了让我们能够更好的了解数据挖掘,马昱欣博士还推荐了3篇数据挖掘相关的综述论文,让我们带回满满的干货。
下午第二位分享的老师是来自武汉大学新闻与传播学院的王琼老师。她带来的是“数据新闻与数据可视化”的分享,分享主要分为四个部分。
王老师首先介绍了数据新闻的基本概念,以及数据新闻与计算机辅助新闻的区别,一个强调技术手段,一个强调内容。其次又介绍了数据新闻的呈现形式以及几个交互可视化数据案例:
1)社会新闻案例:文章通过一个问题“你觉得什么样的职业最为危险”,之后用户可以根据自己的回答一步一步探索这个话题;
2)产业新闻案例:对车辆的一个爱好统计信息可视化;
3)教育方面的可视化:输入学校名称,用可视化显示与该学校有关的一切信息;
4)娱乐产业上的可视化:将可视化和文字结合报道历年来奥斯卡的获奖情况;
5)视频方式的数据新闻:NPR的展示全球人口变化的视频数据新闻。随后,介绍了数据新闻的几个迷思,其中王老师强调,数据可视化是为了帮助人们理解数据,并不是数据新闻的必要点。最后,王老师介绍了她所从事的工作,工作地点是镝次元数据新闻研究中心,其中综合了计算机、新闻等各个学院的学生与老师,一起合作建立了一个数据写作社区,让所有人一起探索数据的价值,还有推广数据新闻的线上沙龙。一场报告听下来,明显能够感觉到王老师的想法很新颖,所做的研究也相当有意义。
第三个讲者是来自复旦大学软件学院的姜忠鼎老师,他带来的报告的主题为“AR+VR+VIS”,主要从以下六部分分享了AR、VR以及VIS。
首先,姜老师通过几个案例,介绍了AR,VR,MR的基础概念,姜老师强调VR中一切都是假象,AR中可以分清真假,MR无法分清真假。随后,姜老师介绍了一个沉浸式可视分析创业案例:virtualitics,引出了沉浸式可视化与可视分析的释义,其目的在于让数据分析师进入大数据内部,为其提供更自然直观的数据探索,分析和协同工作方法,可以激发科学家的想象力,使决策者的决策更为科学便捷,让普通大众欣赏数据所带来的故事。接着,姜老师介绍了VR/AR头盔,在VR/AR头盔的可视分析系统中,VR可以做的事情很多,姜老师展示了一个医学数据VR可视化的案例,还有新加坡团队的一个图数据可视化系统。之后姜老师介绍了VR和AR的一个软硬件趋势,比如眼球追踪,运动追踪,手势相机等等。最后姜老师提到了需要解决的的科学问题和核心技术,例如如何进行系统评估,如何将信息可视化从2D升级到3D等等。姜老师的分享中穿插着大量的视频,让我们真切的体会到AR、VR,视觉上也是十分的享受。
今天最后一位讲者是来自陈为老师实验室的郭方舟博士,郭老师带来的报告的主题是“层次数据可视化”。报告主要分为两部分:层次数据简介与可视化方法介绍。
郭老师讲到层次数据主要着重表现个体之间的层次关系,例如社会关系中的从属关系,组织信息以及逻辑承接关系。在层次数据的可视化方法中,主要包括三种方法:节点链接法,空间填充法以及混合型。
之后分别介绍了每种方法中常用的布局及其实际应用。最后,郭老师提到绘图中应该遵循的美学要求,我们要遵循实用性与美观性遵循的原则,例如尽量避免交叉的边,边的长度要统一等原则,另外之处这些原则除了能使最后的可视化结果更加美观,还能减少对用户的误导。