时间: 2020年11月12日(本周四) 09 : 00
地点: 望江校区基础教学楼B座318实验室
研读成员: 李长林 温啸林
Part1
分享者: 李长林
分享内容:
[1] Ma, Yuxin, and Ross Maciejewski. "Visual Analysis of Class Separations with Locally Linear Segments." IEEE Transactions on Visualization and Computer Graphics (2020).
[2] Shin, Minjeong, et al. "Influence flowers of academic entities." 2019 IEEE Conference on Visual Analytics Science and Technology (VAST). IEEE, 2019.
论文简介:
[1]高维标记数据广泛存在于许多实际应用中,如分类和聚类。分析这些数据集的一个主要任务是探索从机器学习模型中衍生出的类分离和类边界。降维技术通常应用于通过描述来自多个类的数据分布的低维表示来支持分析人员探索底层决策边界结构。然而,由于在复杂的非线性决策边界结构中缺乏显示分离的能力,这种基于线性投影的分析受到了限制,并可能导致高失真和低可解释性。为了克服这些问题,提出了一个可视化的分析方法,利用线性投影的可解释性从线性问题来支持分析时,探索非线性分离结构。我们的方法是提取一组局部线性线段,近似的拟合非线性分离。不像传统的基于投影的分析,数据实例被映射到一个单一的散点图,该方法支持通过多个局部投影结果的复杂类分离的探索。
[2] 提出一个新的视觉隐喻"影响力之花",用于描述学术实体的影响力,包括人物、项目、机构、会议和期刊。虽然许多工具都可以量化影响,但该文献的目标是公开实体之间的影响流。“影响之花”是一个以自我为中心的图,查询实体位于中心。花瓣的样式反映了同类型或不同类型的其他实体之间的影响力。例如,人们可以通过研究主题来分解研究实验室的传入和传出影响。“影响力花朵”使用了微软学术图表的最新数据统计,包括2.12亿作者,1.76亿出版物和12亿次引用。交互式网络应用“影响力地图”(Influence Map)就是围绕这个搜索和策划可视化的中心隐喻而构建的。同时还提出了一种可视化的比较方法,可以突出影响模式随时间的变化。
Part2
分享者: 温啸林
分享内容:
[1] D. Shi, X. Xu, F. Sun, Y. Shi and N. Cao, "Calliope: Automatic Visual Data Story Generation from a Spreadsheet," in IEEE Transactions on Visualization and Computer Graphics.
[2] M. Oppermann, R. Kincaid and T. Munzner, “VizCommender: Computing Text-Based Similarity in Visualization Repositories for Content-Based Recommendations,” in IEEE Transactions on Visualization and Computer Graphics.
论文简介:
[1]以叙述性可视化形式显示的视觉数据故事(例如海报或数据视频)经常用于面向数据的故事讲述中,以促进对故事内容的理解和记忆,但技术障碍(例如数据分析,可视化和脚本编写)使生成可视数据故事变得困难。现有的创作工具依赖于用户的技能和经验,这些技能和经验通常效率低下,但仍然很困难。本文中介绍了一种新颖的视觉数据故事生成系统Calliope,该系统通过自动流程从输入电子表格创建视觉数据故事,并基于在线故事编辑器简化了对生成的故事的修订。Calliope结合了一种新的面向逻辑的蒙特卡洛树搜索算法,该算法探索输入电子表格提供的数据空间,以逐步生成故事片段(即数据事实)并按逻辑顺序组织它们。数据事实的重要性是根据信息论来衡量的,每个数据事实都在图表中可视化并由自动生成的描述加上标题。文章通过三个示例故事,两个对照实验以及对10位领域专家的一系列访谈来评估所提出的方法,评估表明Calliope有助于有效地生成可视数据故事。
[2]基于云的可视化服务使可视化分析比以往任何时候都更广泛的受众。 诸如Tableau之类的系统已经开始以交互式可视化工作簿的形式积累越来越多的分析知识资源库。共享时,这些集合可以形成视觉分析知识库。但是,随着馆藏规模的增加,查找相关信息的难度也随之增加。基于内容的推荐(CBR)系统可以帮助分析人员查找和管理与其兴趣相关的工作簿。为了实现这一目标,本文专注于代表可视化主题的基于文本的内容,而不是视觉编码和样式。讨论与基于可视化规范创建CBR相关的挑战,并更具体地探讨如何使用Tableau工作簿规范作为内容数据源来实施所需的相关性度量。本文还演示了可以从这些可视化规范中提取哪些信息,以及如何使用各种自然语言处理技术来计算工作簿之间的相似性,以此作为衡量相关性的一种方法;报告了一项基于人群的用户研究,以确定提出的相似性度量是否接近人类的判断。 最后,选择LDA作为特定模型并在概念证明推荐工具中对其进行实例化,以测试相似性度量的基本功能。