CHI23 Day 2
4月25日,CHI23大会进入第二天议程。今天的分享将包括以下两部分:王凤杰同学做口头报告;专题报告,包括:数据分析与表征、面向数据科学家和文献综述的工具、在线社区。
王凤杰同学做口头报告
Slide4N: Creating Presentation Slides from Computational Notebooks with Human-AI Collaboration
报告人:Fengjie Wang (Sichuan University), Xuye Liu (University of Waterloo)
这篇工作是四川大学、滑铁卢大学与IBM研究院的合作论文,主要指导老师是四川大学朱敏老师和滑铁卢大学赵建老师。这是朱敏老师团队第一次亮相人机交互领域的顶级会议,具有里程碑式的纪念意义。
今天的报告采用提问的方式串联整个故事,从一开始问题的引出,到现有方法的介绍,再到实现细节及评估。在QA环节也收获了两个有意义的提问,包括:怎样的工作适合AI,哪些工作适合人?用户实验带来怎样的设计启示?
近年来,有许多工作关注如何使数据科学工作变得更简单,例如,自动化的数据处理,尝试超参数的候选值,模型训练等。此类工作大多仅支持数据科学工作技术层面的任务。本文另辟蹊径,支持技术性不强但关键的交流任务。本文的一个核心观念是AI中人的因素,这与CHI不言而合,更具体的讲,本文将繁琐重复性的工作交给AI来完成,并给予用户适当的控制来引导AI、完善AI生成内容,通过人机协作的方法来简化从计算机笔记本制作幻灯片的全流程。下面是本工作的大致介绍。
计算笔记本是数据科学家普遍采用的分析工具,为了与团队其他成员交流分析结果,他们被迫使用其他演示工具(例如PowerPoint)来创建幻灯片。然而,将计算笔记本中的内容(如代码)转变成幻灯片上的内容(如要点),需要很多繁琐且重复的工作。
鉴于此,本文设计并实现了Slide4N,这是一个面向数据科学家的交互式智能助手,用于从计算笔记本中创建幻灯片。Slide4N利用先进的自然语言技术,从用户选择的笔记本单元中提炼出关键信息,采用合理的布局对它们进行组织,并支持直观的交互以进一步完善和定制生成的幻灯片。本文通过一个用户实验评估了Slide4N的有效性和实用性,整体而言,与全手动或全自动的方法相比,参与者更喜欢本文提出的人机协作的方法。
此外,本文对未来类似工具的设计提了一些建议,包括:场景驱动的幻灯片生成、将制作幻灯片的素材与幻灯片进行绑定、为幻灯片推荐合适的可视化视图等。
数据分析与表示
ChartDetective: Easy and Accurate Interactive Data Extraction from Complex Vector Charts (*BEST PAPER)
报告人:Damien Masson, University of Waterloo
从栅格化的图像中提取底层数据是繁琐而不准确的;数值可能被部分遮挡或难以区分,而且图像的质量限制了被恢复的数据的精度。为了解决这些问题,作者引入了一个半自动的交互式系统,利用矢量图轻松而准确地提取底层数据。该系统的设计是为了充分利用矢量信息,依靠一个拖放界面,结合选择、过滤和预视化功能。用户研究表明,参与者花了不到4分钟的时间就从CHI上发表的图表中准确地恢复了数据,这些图表具有不同的风格,例如,数千个数据点、不同编码的组合,以及部分或完全被遮挡的元素。与其他依赖光栅图像的方法相比,我们的工具成功地恢复了所有的数据,即使是隐藏的数据,相对误差也降低了78%。
该工作先有图再有数据,它将传统的基于栅格化图像的数据恢复工作切换到基于矢量图的场景,这启示我们可尝试在不同的场景下关注矢量图。作者建议未来工作包括:支持栅格化图像的数据恢复、支持渲染文字的识别、支持更多种类的图表、支持基于建议的自动选择。此外,鉴于矢量图具有大量的优势,作者号召图表制作者以SVG的形式分享图像。
Charagraph: Interactive Generation of Charts for Realtime Annotation of Data-Rich Paragraphs
报告人:Damien Masson, University of Waterloo
文件中的段落往往充满了难以提取、比较和解释的数字。为了帮助读者理解文本中的数据,作者引入了Charagraphs的概念:动态生成的交互式图表和注释,用于现场可视化、比较和操作文本中的数字数据。作者定义了图表的三个特征:利用有关数据的相关文本信息;整合文本和图形表示;以及在不同背景下进行交互。作者提供了一个文档查看器来选择文本数据;生成和定制图表;使用其他文本数据合并和完善图表;以及在文本和可视化之间同步识别、过滤、比较和排序数据。研究结果显示,参与者可以很容易地为不同的富含数据的文本例子创建图表,当回答有关文本中的数据的问题时,与只阅读文本相比,前者更准确。
该工作关注富文本中数据的可视化,是先有数据再有图表,跟ChartDetective是互逆过程,是同一作者的两篇文章。作者提到未来可探索的方向包括:探索Charagraph的设计空间、支持先进的自然语言处理、支持其他可视化和任务、评估Charagraph在信息保留和用户参与方面的影响力。
multiverse: Multiplexing Alternative Data Analyses in R Notebooks (*HONORABLE MENTION)
报告人:Abhraneel Sarma, Northwestern University
在真实的工作场景中,通常有大量的方法来分析一个数据集。但该相信哪一种呢?面对这种不确定性,分析师可能会采用多元分析:对数据集进行所有合理的分析。然而,这在认知上和技术上都很困难,如何指定和执行对数据集的所有合理分析组合?我们提出了multiverse,这是一个在R中实现多元分析的工具,具有支持现有计算笔记本工作流程的表达式语法。multiverse支持通过对单一分析的局部修改来建立一个多元分析,并通过修剪多余的计算来优化执行。
探索式数据分析会给数据分析人员提供很多灵活性,但灵活性意味着不确定性和随意性,这难免会导致分析结果带有一定的随机性,而多元分析是解决该问题的有效方法,但开展多元分析本身是繁琐耗力的,本文基于此展开研究。
面向数据科学家和文献综述的工具
CiteSee: Augmenting Citations in Scientific Papers with Persistent and Personalized Historical Context(*BEST PAPER)
报告人:Joseph Chee Chang, Allen Institute for AI
在阅读一篇学术文章时,引文帮助研究人员了解当前文章的背景并发现相关的前期工作。然而,在文献审查过程中,对所遇到的数百条引文进行优先排序并使之合理化,这可能是一个挑战。本文介绍了CiteSee,这是一个论文阅读工具,它利用用户的发表、阅读和保存活动来提供围绕引文的个性化的视觉增强和背景。首先,CiteSee通过浮现用户曾经引用或打开的已知引文,将当前的论文与熟悉的语境联系起来。其次,CiteSee通过突出显示基于保存和阅读历史的相关但未知的引文,帮助用户确定其探索的优先次序。实地部署表明,CiteSee帮助参与者跟踪他们的探索,并通过引文支持更好的情景意识和更多有价值的论文发现。
本文的设计主要考虑三个维度:发现相关的引用、使熟悉的文章浮出水面、支持基于个性化历史的论文理解。
Relatedly: Scaffolding Literature Reviews with Existing Related Work Sections
报告人:Srishti Palani, University of California+Allen Institute for AI
想要研究一个科学课题的学者必须花时间去阅读,提取意义,并确定许多论文之间的联系。随着科学文献的增加,这变得越来越有挑战性。同时,作者在论文的相关工作部分总结了之前的研究,尽管这只是为了支持单篇论文的范围。用户研究发现,虽然阅读多个相关工作段落有助于概述一个主题,但很难驾驭重叠和分歧的参考文献和研究焦点。在这项工作中,我们设计了一个系统,即Relatedly,它为探索和阅读一个主题的多个相关工作段落提供了支架,其特点包括动态重新排序和突出显示,以突出未探索的不同信息,自动生成描述性的段落标题,以及降低冗余信息的亮度。
本文来自与CiteSee一样的机构,借助AI的力量帮助研究人员加快、加深对某个主题相关工作的理解。在设计时,主要考虑了三个维度:支持用户推断出更高层次的有意义的主题组织,并深入到副主题中去;使用户能够快速地确定优先次序,并探索相关工作段落之间的相似性和差异性;帮助用户跟踪他们已经探索过的段落和参考文献。
在线社区
Making Sense of Post-match Fan Behaviors in the Online Football Communities
报告人:Yucheng WANG, City University of Hong Kong+Columbia University
职业体育有庞大的粉丝群,他们聚集在网上的体育粉丝社区。体育社区适合作为研究线下环境对线上社区行为影响的沙盒。到目前为止,之前的工作并没有通过研究详细的社区讨论内容来提出对线下-线上联系的详细研究。为了填补这一空白,这项工作以2020-2021赛季英超球队Reddit在线社区的数据为基础,对在线社区关于足球(soccer)比赛的评论进行了全面研究。我们提出了一个指标 "差距得分",通过衡量球迷赛前预期和实际比赛结果之间的差距来量化线下事件的影响。利用这个指标,我们调查了球队的表现是如何影响评论的情绪、讨论主题和评论投票的模式的。研究结果强调了线下活动和在线讨论之间存在的密切联系,并揭示了在线社区的理论和实践意义。
该工作聚焦线下活动对线上社群的影响,关注社群舆论、主题演变等方面。此外,该工作指出在线社区需要合适的引导以保证其正常运转,包括:制定社区规范、构建合适的审核机制等。