2021年秋季学期视觉计算实验室第十一次论文研读预告

时间:2021年12月16日(本周四) 09: 30

地点:望江校区基础教学楼B座318实验室

研读成员:朱佳旻、高雯雯

Part1

研读成员:朱佳旻

分享内容:

[1] Kristiansen Y S, Garrison L, Bruckner S. Semantic Snapping for Guided Multi-View Visualization Design[J]. IEEE Transactions on Visualization and Computer Graphics, 2021.

[2] Willett W, Aseniero B A, Carpendale S, et al. Perception! Immersion! Empowerment!: Superpowers as Inspiration for Visualization[J]. IEEE Transactions on Visualization and Computer Graphics, 2021.

论文简介

[1] 对信息可视化通常由多个可视化视图组成,用于促进对底层数据的理解。一个常见的例子是仪表板,它经常用于金融、流程监控和商业智能等领域。然而,在组合这种多视图可视化时,用户可能不了解已有的可视化设计指南,并且缺乏专业的设计知识。在本文中,我们介绍了语义捕捉,这是一种帮助非专家用户从预先存在的视图集设计有效的多视图可视化的方法。将特定视图放置在画布上时,它将与其余视图“对齐”——不是基于其几何布局,而是基于视觉编码本身,例如数据维度如何映射到视觉通道。我们的方法通过动态地检测来为存在冲突、误导或模棱两可的可视化设计提供解决方案,同时提供建议和替代方案。通过这种方法,可以引导用户在构造可视化视图时避免常见问题。最后我们提供的例子和案例研究表明了我们方法的有用性和有效性。

图1 可视化设计的检测流程示例

[2] 我们探索虚构的超级英雄的镜头如何帮助描述可视化赋予人们能力,并为创作新的可视化系统提供灵感。研究人员和实践者经常吹嘘可视化技术“让看不见的东西看得见”和“增强认知能力”的同时,超级英雄漫画和其他现代小说常常描绘具有类似神奇能力的人物,他们能够以超越传统人类认知的方式看待和解释世界。我们调查了这些领域的交叉点,并展示了如何使用超级英雄的语言来描述现有的可视化系统。我们介绍了两个框架:第一个框架描述了七种潜在的机制,它们构成了小说中描绘的各种视觉超能力的基础。第二部分确定了可视化工具和界面可以向使用它们的人灌输能力意识的七种方式。在这些结果的基础上,我们展示了一系列不同的“可视化超级力量”,并突出了可视化社区创建新系统和交互的机会,这些新系统和交互可以赋予数据新的体验。

图2 认知超能力背后的潜在机制

Part2

研读成员:高雯雯

分享内容

[1] Liu M, Shi J, Li Z, et al. Towards better analysis of deep convolutional neural networks[J]. IEEE transactions on visualization and computer graphics, 2016, 23(1): 91-100.

[2] Wongsuphasawat K, Smilkov D, Wexler J, et al. Visualizing dataflow graphs of deep learning models in tensorflow[J]. IEEE transactions on visualization and computer graphics, 2017, 24(1): 1-12.

论文简介

[1] 深度卷积神经网络 (CNNs) 在许多模式识别任务中取得了很大的性能突破,然而由于其难以理解的函数和不明确的工作机制,训练高质量的深度模型依赖于耗时的试错过程,人们很难从失败或成功的训练案例中总结出可重用的知识,并将其转移到其他相关深度学习模型的开发中。为了应对这些挑战,本文开发了一个名为 CNNVis 的交互式可视分析系统,如图3所示,旨在帮助机器学习专家更好地理解、诊断和改进 CNN。

图3 帮助专家理解、诊断和改进深度 CNNs 的可视化系统 CNNVis

[2] TensorFlow 是谷歌开发的、当下最流行的机器学习软件库之一。它采用数据流图 (Dataflow Graph) 来表达机器学习算法的计算过程,用户可以定制不同的数据流图来构建自己的算法。但随着神经网络规模的扩大、复杂性的增加,算法研发人员很难把握算法的各部分体系结构。为此,本文提出了可视化工具 TensorFlow Graph Visualizer,通过可视分析帮助用户在 TensorFlow 中进行算法分析与开发。图4展示了用 TensorFlow Graph Visualizer 呈现卷积神经网络 (Convolutional Neural Network, CNN) LeNet-5 模型的算法结构,图4(a) 自下而上可以依次看见图片的读取 (read)、预处理 (process_image)、批处理 (shuffle_batch)、两个卷积层 (conv1 & conv2)、两个全连接层 (fully3 & fully4)、作为输出的激活函数层 (softmax_linear)、以及计算反馈的残差操作 (cross_entropy) 等等。其中同样可以看见如初始化 (init)、池化 (pooling)、归一化 (norm) 等元操作。图4(b) 显示了一个结构展开后的细节。利用本文提出的图构建和布局方法,能较好地从源代码中提取出深度学习算法的整体逻辑结构。用户通过交互探索,也能够接触到底层的操作细节,方便开发者对算法进行更细致的调试和检错。

图4 卷积神经网络 LeNet-5 模型的算法结构