2021年春季学期视觉计算实验室第四周论文研读预告

时间: 2021年3月24日(周三) 09 : 30
地点: 望江校区基础教学楼B座318实验室
研读成员: 刘尚松 温啸林
Part1
分享者:刘尚松
分享内容:
[1] Fujiwara T, Sakamoto N, Nonaka J, et al. A Visual Analytics Framework for Reviewing Multivariate Time-Series Data with Dimensionality Reduction[J]. IEEE Transactions on Visualization and Computer Graphics, 2020.
[2] So W, Bogucka E P, Scepanovic S, et al. Humane Visual AI: Telling the Stories Behind a Medical Condition[J]. IEEE Transactions on Visualization and Computer Graphics, 2020.
论文简介:
[1] 分析多变量时序数据对于研究现实世界中的各种现象已越来越重要,例如电子健康记录(血压、心率)分析、并行计算机系统的性能诊断、工厂生产线故障检测、交通系统优化等。传感设备日益增长的能力和使用提高了多变量时序数据的粒度、质量和可得性,同时,数据大小和尺寸的增加使分析任务更加艰巨挑战。为了高效地分析量大和高维的数据,降维方法常被用于揭示数据的内在结构和特征。但是降维通常应用于单时间点多变量数据或单一时序数据的子集,因此需要手动检验和关联不同数据子集的降维结果。当数据维度在时间点或属性上都很大时,手动任务变得过于枯燥和不可行。本文提出了一个新的降维框架,它能整体全局地处理时间依赖型多变量数据,以提供数据的全面概览。在该框架中,把降维分为两个步骤。当将数据的实例、时间点和属性视为三位列阵时,第一步将阵列的三个轴降到两个,第二步将二维数据可视化到低维空间。此外,该框架还与对比学习方法和交互式可视化技术相结合,以提高分析人员解释降维结果的能力。作者使用真实世界的数据集进行了四个案例研究,以展示框架的有效性,还进行了与其他降维方法的定性比较。

图1 系统概览图
[2] 理解生物学是管理医疗情况的关键,心理和社会方面也很重要,但这两个方面难以量化和互通。 为了量化心理方面的工作,这项工作在专门研究14种医疗条件的子社区中挖出了大约50万个Reddit博文,并采用了新的深度学习框架。这样能够将与医疗条件相关的提及与情感相关联。为了量化社会方面,本工作设计了一种概率方法,该方法从英格兰国家卫生局挖掘公开处方数据,以计算药物处方的患病率,并将这种患病率与人口普查数据相关联。最终为了通过视觉方式传达的方法来讲述每种医疗状况的生物学,心理学和社会学方面,我们设计了一种叙事风格的分层Martini Glass可视化效果。 在一项涉及52位参与者的用户研究中,在与我们的可视化交互之后,他们中的相当多的人改变了以前持有的观点:10%的人更重视医学状况的心理方面,而27%的人更赞成使用社交媒体数据在医疗保健中的存在,这表明了有说服力的元素在交互式可视化中的重要性。
图2 系统概览图
Part2

分享者:温啸林
分享内容:
[1] Wu A, Xie L, Lee B, et al. Learning to Automate Chart Layout Configurations Using Crowdsourced Paired Comparison[J]. arXiv preprint arXiv:2101.03680, 2021.
[2] Law P M, Lo L Y H, Endert A, et al. Causal Perception in Question-Answering Systems[J]. arXiv preprint arXiv:2012.14477, 2020.

论文简介:
[1] 文章提供了一种通过从人的偏好中学习来自动化图表布局的参数配置的方法。 现有的制图工具通常使用预定义启发式方法来确定布局参数,从而产生次优的布局。人们可以通过反复调整多个参数(例如,图表大小,间距)来获得视觉上令人满意的布局。但是,这种反复试验的过程是不系统且耗时的,无法保证得到改进。 为了解决这个问题,文章提出了Layout Quality Quantifier(LQ2)。这是一种机器学习模型,从成对的众包数据中学习知识,对图表布局进行评分。结合优化技术,LQ2可以推荐布局参数,以提高图表的布局质量。文章将LQ2应用于条形图,并进行用户研究通过检查其产生的布局质量来评估其有效性。 结果表明,与外行人调整的布局和基线布局相比,LQ2可以生成更具视觉吸引力的布局。这项工作呈现了量化人类对图表布局的喜好和美学的可行性和用法。

图3 LQ2工作流程图
[2] 根因分析是常见的数据分析任务。虽然问答系统使人们可以轻松地阐明一个“why”问题(例如,马萨诸塞州的学生为什么平均获得ACT Math分数很高)并获得答案,但这些系统通常会产生令人怀疑的因果主张。为了调查此类声明如何误导用户,文章进行了两个众包实验,研究了显示不同信息对问答系统用户感知的影响。实验发现在一个偶尔提供不合理主张的系统中,显示一个散点图可以增加不合理因果主张的合理性。同样,仅仅警告参与者“相关性并不是因果关系”会使参与者更加谨慎地接受合理的因果主张。文章还观察到参与者有很强的将关联与因果关系混为一谈的趋势。然而,警告可以减少这种趋势。基于上述发现,文章提出了减少使用问答系统时因果错觉的方法。
图4 众包实验设计