2019年春季学期视觉计算实验室第十七周论文研读预告

论文研读时间: 2019年月27日9点30分
论文研读地点: 四川大学望江校区基础教学楼B座318(视觉计算实验室)
论文分享者: 杨瑞丰、吴若婷

分享者一:杨瑞丰

论文目录:
[1]Pranathi Mylavarapu, Adil Yalçin, Xan Gregg, and Niklas Elmqvist. 2019. Ranked-List Visualization: A Graphical Perception Study. In Proceedings of the ACM SIGCHI Conference on Human Factors in Computing Systems (CHI 2019), May 4–9, 2019, Glasgow, Scotland, UK. ACM, New York, NY, USA, 12 pages
[2]Po-Ming Law, Subhajit Das, and Rahul C. Basole. 2019. Comparing Apples and Oranges : Taxonomy and Design of Pairwise Comparisons within Tabular Data. In CHI Conference on Human Factors in Computing Systems Proceedings (CHI 2019), May 4–9, 2019, Glasgow, Scotland UK. ACM, New York, NY, USA, 12 pages.

论文简介:
论文一:
背景与目的:探究现有排名可视化的方法并进行总结和分析,比较现有方法的优缺点。
方法:设置详细的用户感知实验。
输出:1.其中的实验任务可以作为之后可视化方法有效性的评价指标。2.对排名列表可视化做了一个很好的总结。
---1-3

图1 Scrolled barchart
    水平bar的放置有利于label的摆放,并且对于一般PC的屏幕上,水平方向可以带来更大的精度。然而,这个可视化受限于屏幕的大小,若列表项的数量特别多时,需要增加scroll。Scroll的引进不会影响到水平方向的精确感知,但会浪费用户的时间和精力。

---2-1

图2 Wrapped bars
    Stephen Few在2013年提出了Wrapped bars,目的是消除掉scrolling的影响。他将整个列表划分成C列,通过压缩水平方向的长度来使得屏幕上能放置所有的bar。这样做的缺点在于,将不会有一个统一的baseline。

---3-1

图3 Packed bars
    Xan Gregg在2017年提出了Packed bars,希望能最大地利用屏幕上的空间。因为bar越长,bar的精度就越高。他使用一个贪心的算法来布局。这样布局会造成原有顺序的丢失,且除了第一列外,不再具有baseline。

---4

图4 Piled bars
    MehmetAdilYalçın在2017年提出了Piled bars。与wrapped bars类似,他将整个列表划分成C列,所有的列都共享一个baseline,然后使用颜色和阴影来区分不同的堆积次序。优点:每个bar都利用了最大的水平分辨率,缺点:极端情况下,label会相互重叠。

---5

图5 Zvinca plot
    Stephen Few在2017年提出了Zvinca plot。与piled bars类似,只是将bar变成了dot,channel相应地由length变成了position。优点:不需要使用颜色和阴影,同时dot的label布局将会更加自由,以减少重叠。

---6

图6 TreeMap
    treeMap是一个常见的用于表示层次结构数据的可视化方法,但是最近越来越多的人使用它来可视化排名列表。Treemap的缺点在于使用了面积来编码value,其面积在视觉感知上不如length。

---7

图7 bubble chart
    与treeMap类似,它使用圆而不是矩形来作为mark。其中,每个项的位置几乎没有任何含意。

    为了实际比较这些可视化方法,作者设计了3个实验任务。
    任务1:给定一个选中的项,要求被试给出该项的排名等级。
    任务2:给定两个选中的项,要求被试给出该两项的值的差距
    任务3:要求被试评估所有项的平均值。
    用户总共选取了180个被试(from Amazon Mechanical Turk)。每个被试将会被分配一个可视化形式(共6个,无packed bubble chart),1个可视化任务(共3个),3个数据集(75,150,300),完成10次试验。
    结果如下:
8

图8 实验结果

针对假设1,综合来看SB确实比其他的慢一些,但某些情况下,差距不明显。
针对假设2,TM的正确率从来没有最低过,某些情况下还是最佳。拒绝假设2。
在任务1中,WB的表现最好,TM的表现非常不错。
在任务2中,ZP的正确率最低,TM仍旧有非常好的表现。
在任务3中,treeMap和PaB都有较高的错误率。
结合数据规模来看,在任务2中,只有SB的时间随着数据量的增大而增加。在任务3中,ZP和TM的时间反而随着数据量的增大而减少。

    总结:这篇文章很好的总结了排名可视化的方法,并通过实验对比视图之间的差异优劣。从本篇文章中,可以抽取其中视图之间对比的方法思路,为学位论文撰写有效性部分提供有力的印证。



论文二:

背景:成对比较问题很常见,它可以帮助我们进行类比推理、社会比较、决策以及知识发现。然而,我们经常在两个感兴趣的东西中不易比较,比如苹果和橙子、北京和纽约。

目的:系统地研究成对比较问题

输出:作者提出了成对比较的分类,开发了一个电子表格应用程序Duo以帮助人们完成成对比较。此外,他们还研究了用马虎规则(sloppy rules)和自然语言来指定成对比较问题的不同。

通过分析从用户那里搜集的成对比较问题,作者们将它们按三个维度进行编码,即重复(repetition)、群组(group)和属性(attribute)。重复维度有两个类别,即单个(single)和重复(repeated)。单个成对比较具有“compare A to B”的形式,重复成对比较具有“compare A to B, C, D, etc.”的形式。人们通常会在对A不了解,并且想通过将A与B,C,D等他们所了解的事物来比较的方式了解A的情况下提问重复成对比较问题。群组维度有三个类别,即一对一(one to one),一对多(one to multiple)和多对多(multiple to multiple)。它们分别是比较两个单对象群组,一个单对象和一个多对象群组,以及两个多对象群组。例如,“比较中国最大的三个城市和美国最大的三个城市的犯罪率”就是一个多对多的成对比较问题。属性维度有两个类别,即属性存在(attribute present)和属性缺失(attribute absent)。当人们在提问时指定了他们想要比较的属性时,这个问题便是属性存在的成对比较问题。有时候人们会不指定比较的属性,他们希望广泛地理解两个事物的相同点和不同点,并且可能不了解哪些属性对他们而言是重要的。
之后作者们开发了一个电子表格应用程序Duo来帮助用户完成成对比较。Duo从两个方面出发,一是用户指定成对比较问题,二是回答这些问题。在用户指定成对比较问题这个部分,基于自然语言直观易学的特点,作者们想使用自然语言作为输入。然而,在描述长句时,自然语言会变得不方便,有可能会存在表意不清的问题。此外,使用自然语言还无法很好地利用作者们总结出的分类。基于上述考虑,作者们最终选择使用规则来作为输入。作者定义了两类规则,分别是针对群组定义(group definition)和比较的属性(attributes under comparison)。针对群组定义的规则又被进一步分解为基础规则(base rules)、包含规则(inclusion rules)和排除规则(exclusion rules),分别对应于与(and)、或(or)和非(not)三种操作符。为了使得人们能够方便地表述和操作,Duo允许使用马虎规则来进行规则指定。马虎规则具有支持变化、容忍拼写错误、顺序独立性和丰富的视觉反馈等特性。前三个特性保证了用户可以以一种很方便的方式来输入规则,比如“Region is Southeast”,“Region=Southeast”,“Region Southeast”,“rg=s-east”和“reg=southe”都会被认作“Region=Southeast”;第四个特性使得马虎规则值得信赖。如图1所示,用户在输入时,Duo会高亮对输入的属性和值的解释。 对于数值型属性,Duo显示带有密度图的滑块,并根据当前输入调整滑块范围。
2-1

图1 马虎规则中的视觉反馈

对于成对比较问题的回答,Duo首先会生成一句话来描述指定的比较,以帮助用户找出指定中的错误(图2b)。之后针对不同类型的问题,Duo采用不同的方式来回答。对于单个成对比较,属性会被分类为高度相似,高度不同和其他(图2c)。用户鼠标悬停在属性上会显示对应的可视化以及简短的文本描述。可视化的形式由比较的类型来确定。对于重复成对比较(图2g),群组会被分成相似群组和不相似群组,并会根据相似或者不相似属性的数量进行排序。点击一个群组会显示相似或不相似属性的列表。对于一对一,一对多,和多对多比较,因为它们都属于单个成对比较,所以回答这些比较的区别仅在于鼠标悬停在属性上时显示的可视化的类型。对于一对一比较,可视化显示两个群组的所选属性的值(图2f)。 对于一对多比较,密度图用于显示多对象群组的分布(图2e)。 对于多对多比较,可视化包含两个密度图,每个密度图显示一个群组的分布(图2d)。

2-2

图2 Duo用户界面

最后,作者们通过一个实验来比较实用马虎规则或自然语言作为成对比较输入的情况。他们设计了四种难度的实验。难度依据包含规则的数目来确定。实验会记录用户使用马虎规则或自然语言完成所要求的成对比较指定所需要的时间。此外,在实验结束后,用户还会被要求回答“哪个界面更容易指定成对比较问题?”和“您更喜欢使用哪个界面执行成对比较任务?”这两个问题。如图3所示,从试验结果中我们可以看出,对于简单任务和中等难度的任务,马虎规则和自然语言在完成时间和易于指定方面都具有可比性;对于困难和更困难的任务,马虎规则更有效且更容易完成指定。
2-4

图3 实验结果

总结:
这篇文章提出了成对比较的分类方法,以帮助回答“成对比较是什么”的问题;开发了一个电子表格应用程序,以帮助用户进行成对比较;设计了一个用户实验来比较马虎规则和自然语言,得出了“对于困难的成对比较任务,马虎规则允许更快的指定且更受用户喜爱”的结论。


分享者二:吴若婷

论文目录:
[1]Windhager Florian,Federico Paolo,Schreder Gunther,Glinka Katrin,Dork Marian,Miksch Silvia,Mayr Eva. Visualization of Cultural Heritage Collection Data: State of the Art and Future Challenges.[J]. IEEE Transactions on Visualization and Computer graphics,2019.

论文简介:

背景:
经过数十年的现代化,网络上出现了大量的来自美术馆、图书馆、档案馆和博物馆的文化遗产藏品,数字文化遗产数据不断增加,相关学者和一般用户的访问量也不断增多。最近许多方法已经开始允许可视化地访问文化收藏,并通过交互可视化的方式将其作为复杂全面的信息空间进行解释。与传统的Web界面不同,转为文化遗产部门的藏品设计的可视化类型更具有创新型和交互的多样性。

研究方法和贡献:
1.论文作者团队调查并回顾了数字文化遗产藏品的信息可视化方法,分析了70个文化遗产藏品的可视化系统(主要搜索包括信息视觉、视觉分析、人机交互、数字人文关系、数字艺术史和博物馆研究领域中相关期刊、出版物和会议中的作品),多角度对文化遗产藏品可视化界面设计的现状进行了研究和分析,并设计了一个网站来探索这个集合的可视化(http://collectionvis.org)。
2.作为一个跨学科的团队,论文作者团队讨论了新的设计原则和策略,以及它们是如何解决了文化遗产藏品相关研究的挑战的。

1

图1 文化遗产数据可视化系统的界面

2

图2 文化遗产数据可视化方法