2021年春季学期视觉计算实验室第一周论文研读预告

时间: 2021年03月03日(周三) 09:30
地点: 基础教学楼B座318实验室
研读成员: 朱浩天
研读内容:'AI+VIS'论文选读
[1] J. Wang, L. Gou, W. Zhang, H. Yang and H. Shen, "DeepVID: Deep Visual Interpretation and Diagnosis for Image Classifiers via Knowledge Distillation," in IEEE Transactions on Visualization and Computer Graphics, vol. 25, no. 6, pp. 2168-2180, 1 June 2019.
doi: 10.1109/TVCG.2019.2903943.
[2] T. Tang, R. Li, X. Wu, S. Liu, J. Knittel, L. Yu, R. Ren, T. Ertl and Y. Wu, "PlotThread: Creating Expressive Storyline Visualizations using Reinforcement Learning," in IEEE Transactions on Visualization and Computer Graphics, vol. 27, no. 2, pp. 294-303, Feb. 2021.
doi: 10.1109/TVCG.2020.3030467.

[1]深度神经网络(DNNs)由于其优越的性能,在多个学科中得到了广泛的应用。然而,在大多数情况下,DNN被认为是黑匣子,对其内部工作机制的解释通常是具有挑战性的。鉴于模型信任通常建立在对模型如何工作的理解的基础上,DNN的解释变得更加重要,特别是在安全关键的应用(例如医疗诊断、自主驾驶)中。
本文提出了DeepVID,一种视觉解释和诊断DNN模型的深度学习方法,特别是图像分类器。详细地,作者训练了一个小的局部忠实模型,以模拟特定数据实例周围原始繁琐DNN的行为,并且局部模型足够简单,可以直观地解释(例如,线性模型)。知识蒸馏用于将知识从繁琐的DNN转移到小模型,并使用深度生成模型(即变分自动编码器)在感兴趣的实例周围生成邻居。这些邻居具有较小的特征差异和语义意义,可以有效地探测DNN在感兴趣的实例周围的行为,并帮助小模型学习这些行为。通过综合评估,以及与深度学习专家一起进行的案例研究,作者验证了DeepVID的有效性。

图1. DeepVID主视图


[2]故事情节可视化是展示情节演变和揭示人物之间情景互动的有效手段。然而,由于用户需要在审美目标和叙事约束之间取得平衡,故事情节可视化的设计是一项困难的任务。尽管基于优化的方法在产生美观和清晰的布局方面得到了显著的改进,但现有的(半)自动方法依然存在以下限制:1)对故事情节设计空间的有效探索;2)故事情节布局的灵活定制。
在这项工作中,作者提出了一个强化学习框架,以训练一个人工智能代理,帮助用户有效地探索设计空间,并生成优化良好的故事情节。在此框架的基础上,作者开发了Plot Thread,这是一种创作工具,它集成了一组灵活的交互,以支持故事情节可视化的简单定制。为了无缝地将AI代理集成到创作过程中,采用了一种混合的主动方法,其中代理和设计师都在同一幅画布上工作,以促进故事情节的协作设计。通过定性和定量的实验来评估强化学习模型,并使用用例集合来演示绘图线程的使用。

图2. PlotThread生成的storyline样例


123