2021年春季学期视觉计算实验室第三周论文研读预告暨国家自然科学基金申报汇报

时间 : 2021年03月17日 09: 30
地点 : 望江校区基础教学楼B座318实验室
研读与汇报成员 : 张馨艺、国自然基金申报组成员

Part 1
分享者: 张馨艺
分享内容
[1] Kiesel D, Riehmann P, Wachsmuth H, et al. Visual Analysis of Argumentation in Essays[J]. IEEE Transactions on Visualization and Computer Graphics, 2020.
[2] Borland D, Wang W, Zhang J, et al. Selection bias tracking and detailed subset comparison for high-dimensional data[J]. IEEE transactions on visualization and computer graphics, 2019, 26(1): 429-439.
论文简介:
[1] 本文提出了一个用于探索、分析和比较议论文语料库中的论点结构的可视化分析系统。设计实现了ArguLines列表视图,采用glyph设计,由代表每篇文章的论证单元的符号序列提供对整个语料库的概述。每个字形编码一个论证单元的立场、层次深度和相对位置。且为ArguLines概览视图设计实现了多种排序方式,以揭示典型的论证模式和异常值。用户可以在概览视图中交互选择感兴趣的文章子集,并使用参数单位出现树(AUOT)对其进行详细分析。AUOT使用层次直方图聚合文章子集的论点结构,促进对议论文集论证过程的统计信息和演化趋势的估计,提供对所选子集之间的共性和差异的见解。此外,本文提供文本视图,为验证其他视图得出的结论和注释过程提供必需的文本基础。交互设计方面,本文将视图和交互技术结合起来实现视觉过滤,研究文章子集内立场的演变,并仔细检查论证单元的顺序,使文章语料库能够深入分析。最后,通过专家评审证实了该系统的实用性,并在通过样本语料库揭示了详细的和以前未知的关于论证方式的信息。

图1 VisAEssays系统界面概览

[2] 大型复杂数据集在许多领域都很常见,可视化分析工具在探索和回答关于这些大型数据集的复杂问题方面扮演着越来越重要的角色。然而,许多可视化并不能同时可视化复杂数据集中存在的大量维度,加上许多视觉分析系统能够基于一小部分维度快速、临时地选择群体或同类,导致用户选择在数据子集时可能引入选择偏见。这些非预期副作用可能导致队列不再代表拟研究的更大人群,更一般地来讲,当用户应用过滤器以基于一小组较小的维度来创建数据子集时,其他“看不见的”相关维度的分布可能会有很大的变化,从而对后续分析的有效性产生负面影响。因此,本文提出了可合并到高维探索性视觉分析系统的选择偏差跟踪与可视化的技术,并将重点放在具有现有数据层次结构的医疗数据上。这些技术包括:(1)设计了一种基于树的数据子集起源可视化,显示从初始查询结果到一个或多个最终队列的完整非线性选择过程,以及在每个步骤中引入的选择偏差量。用户可以交互地选择一个与所有数据子集进行比较的基准数据子集,以及一个与基准进行详细比较的焦点数据子集;(2)一组用于在高维数据集中的成对数据子集之间表达选择偏差的可视化,包括基于冰柱图的新颖可视化技术。用户指定的聚合级别被合并到每个可视化中,以有效地缩放高维数据集,同时基于选择偏差对突出维度进行优先级排序;(3)本文在Cadence中集成了本文及其他相关的数据子集比较可视化,Cadence是一个时间事件序列视觉分析和队列选择工具。最后,本文提供示例用例,并报告来自领域专家用户访谈的结果。
图2 系统界面概览

Part 2
分享主题:国家自然科学基金申报汇报
分享人员:国家自然基金申请项目组
分享内容:将介绍选题来源、梳理过程,分享申报系统的使用和注意事项,并将汇报预期输出和个人体会。

123