第十届中国可视化与可视分析大会-Day2

7月22日,第十届中国可视化与可视分析大会继续进行,今天会议的内容主要包括开幕式、特邀报告、圆桌会议、专题报告和论文报告。

第十届中国可视化与可视分析大会开幕式

首先杨建喜教授介绍了到场的领导和嘉宾,接着大会主席、重庆大学秦红星教授宣布大会正式开幕。在开幕式上,重庆大学科学技术发展研究院院长曹华军教授进行了致辞,代表重庆大学对各位专家和来宾表示了热烈的欢迎,向承办协办单位表示感谢,并阐述了此次大会推进学科发展、促进人才培养和交流的主旨。然后秦红星教授介绍了本次大会的筹备情况,论文主席、海报主席、竞赛主席、艺术主席也分别对本次大会的评审、录用情况进行了介绍。开幕式至此圆满结束。

图1. 第十届中国可视化与可视分析大会开幕式现场

大会特邀报告1:Scalable Interactive Visual Analysis

奥地利维也纳工业大学Eduard Groller教授进行了题为《Scalable Interactive Visual Analysis》的报告。可扩展交互式可视化分析将计算机支持的交互式的可视化数据表示与自动化技术相结合,以增强认知并促进建模。Eduard Groller教授通过可扩展可视化、不确定性可视化、引导式交互和沉浸式分析等相关的示例对这些概念进行说明,并介绍了模型化、沉浸式分析、自适应自解释分析等可扩展的、交互式可视分析的未来研究方向。

图2. 特邀报告1现场

圆桌论坛1:可视化如何高效解决行业问题

本次论坛邀请了五位嘉宾分别介绍可视化在不同行业的具体应用。唐谈博士以“中国历代绘画大系知识体系”为例,探讨了数字人文设计的新范式。王琼教授阐述了媒体数据新闻生产的普遍困境,并介绍了镝数数据可视化融媒体编辑系统在帮助数据新闻生产方面所作的尝试。实验室22级博士王国强展示了数据可视化在空中交通管理、机场运行保障、飞行安全评估中的应用实例,例如虚实融合的态势模拟与实时增强的应用。王勇教授主要通过两篇论文介绍了数据可视化在检测加密货币的金融欺诈行为方面的作用。赵颖教授对于打造可视化的行业应用“生态”, 提出了需求牵引、场景识别、资源整合、行业深耕、人才培养五个过程并进行了简要阐述。

图3. 圆桌论坛1现场
图4. 实验室22级博士王国强报告现场

论文速览&海报速览

参与论文报告的作者们用简短的话语介绍了论文和海报的主要内容。

专题报告3:智能可视互动

基于工具隐喻构件的交互可视化编程架构Libra

报告者:汪云海,山东大学 博士后研究员

汪云海教授首先指出了D3、Vega等传统交互设计工具存在的问题,如难以适应多模态交互场景、缺乏灵活性和可扩展性、以及界面表达与交互行为之间的高耦合性等。为了解决这些痛点,实现对各种常见交互行为的结构化抽象描述以及界面表达与交互行为的分离,汪云海教授的团队借鉴了生活中“工具”的概念,提出了工具交互架构Libra,基于交互器、交互服务、预反馈等组件,支持交互组件的重用、扩展和组合。他们开发的原型系统Libra.js证明了该架构的有效性和易用性。

图5. 汪云海教授报告现场

基于交互式数据可视化的智能人机协作:挖掘,解释与推荐

报告者:陈思明,复旦大学 副教授

在数据分析任务中,AI与人类的合作对于那些不能仅靠AI独立解决的问题变得越来越重要。本次报告中,陈思明教授主要从三个方面对人机融合进行了讨论:社交媒体中的动态数据实时可视分析、语言对话模型的可解释性可视分析、以及利用AI为可视化探索推荐交互行为。

陈思明教授指出,AI有助于我们从海量的社交媒体数据中挖掘有价值的语义信息,结合可视化隐喻可以帮助我们在错综复杂的数据中探索事物的规律。其次,为了打开“AI”的黑箱,我们可以通过可视化和归因方法探讨神经网络的参数和神经层,进而研究开放领域自然语言对话模型的可解释性。最后,陈思明教授介绍了如何利用AI的推荐能力,在博物馆场景中实现智能人机协作的交互推荐可视分析。通过这些案例,陈思明教授向我们展示了人机协作的多种可能性和效果。

图6. 陈思明教授报告现场

基于机器学习的可视化自然语言交互

报告者:刘灿,北京大学 博士

自然语言是可视化交互的重要媒介,包括构建、理解和修改。刘灿博士分别从三个方面介绍了可视化自然语言交互技术的具体应用。首先是可视化整体形式生成,讲者介绍了自然语言驱动的可视化构建,包括自然语言与属性解析、上下文状态机、可视化生成、数据集构建等部分。然后是可视化文本组件生成,例如基于深度学习生成对视图的描述,以及通过构造可视化标题的设计空间来自动生成标题。最后以力驱动的可视化操纵为例介绍了可视化交互功能生成。

图7. 刘灿博士报告现场

专题报告5:可视化数据处理

数据变换代码的解析与可视化

报告者:傅四维,之江实验室 副研究员

数据变换是数据处理中的重要一环,数据分析师通常需要理解数据变换代码的语义。针对数据变换场景,傅四维博士介绍了代码语义解析和可视化的系列工作。在代码语义解析方面,介绍了基于启发式算法和CNN的高效解析流程。在可视化方面,讲解了针对23种数据变换操作设计相应图符的过程。同时,傅四维博士通过案例分析展示了这些方法的有效性。

图8. 傅四维博士报告现场

散点图过度绘制缓解技术

报告者:李泽宇,中国传媒大学 媒体融合与传播国家重点实验室助理研究员

散点图被认为是一种通用的、多态的可视化技术。李泽宇博士首先引入了散点图的过度绘制问题:随着数据规模的增长,代表数据的图元之间大量重叠,严重干扰了散点图在揭示数据模式上的有效性。然后总结了已有的方法,如调整可视外观、数据点采样等,但这些方法都存在一些问题。因此李泽宇博士介绍了一个基于双空间耦合的新方法,并列举了一些大规模散点图可视化未来需要解决的研究问题。

图9. 李泽宇博士报告现场

论文报告Session4

Qutaber: Task-based Exploratory Data Analysis with Enriched Context Awareness

探索性数据分析(EDA)是数据科学家用来分析和调查数据集,并总结其主要特征的一种分析方式。推荐算法的融合显著提升了EDA的效能和吸引力。然而,现有的基于推荐的EDA方法往往侧重于从给定的数据中识别关键的见解,且这些工作中的分析任务往往局限于特定的应用领域。此外,这些系统缺乏足够的情境意识,无法让用户深入理解和分析推荐内容。为了解决这些限制,本文引入了Qutaber,一个基于分析任务的具有上下文意识的EDA系统。作者总结了面向EDA场景的六个核心分析任务,然后提供多度量重排序能力来呈现所有候选图表。此外,本文还使用了机器学习方法来表示这些图表的语义向量,允许用户观察其全局分布特征。 最后,作者通过案例研究展示了Qutaber的实际应用,并通过用户研究进一步评估了该技术的可用性。结果表明,Qutaber能够引导用户进行高效的、上下文感知的探索性数据分析。

图10. Qutaber论文报告现场

SFLVis: Visual Analysis of Software Fault Localization

为了提高软件调试效率,许多基于测试用例的故障定位方法被提出,如基于程序频谱的技术、基于切片的技术等。但是这些方法与实际调试的逻辑相去甚远,仍然需要程序员使用传统的方法。在访谈了5位可视化和软件测试领域的专家后,本文设计了SFLVis,为用户提供了一种提高错误定位效率的新方法。本文设计了一个算法来获取程序执行的过程,并将其与现有的错误定位方法相结合,目标是向用户展示测试用例的执行结果、源代码逻辑以及语句怀疑度,重现测试用例的执行过程。作者还设计了丰富的交互功能,帮助用户探索SFLVis,并从不同角度关联信息,以提高故障定位的效率。为了验证SFLVis的有效性,本文使用西门子套件数据集中的程序进行了案例研究、分组实验和相关访谈。结果表明,与现有的错误定位方法相比,SFLVis可以有效地提高程序员的效率。

图11. SFLVis系统界面