
EuroVis 2025 Day2
6月4日,EuroVis2025 进入第二天议程。今天的分享包括以下两个部分:专题报告:AI增强可视化以及专题报告:音乐和颜色。
专题报告:AI增强可视化
该专题主题是AI增强可视化,会场主席是Gennady Andrienko,下面分享四篇工作。
SUPQA: LLM-based Geo-Visualization for Subjective Urban Performance Question-Answering
随着城市化进程的加速,城市绩效已成为一个日益重要的问题,影响着居民生活的方方面面。然而,城市绩效探索是一个繁琐且高度主观的过程。用户需要手动收集和整合各种信息,或者由于现有专业工具的陡峭学习曲线,花费大量时间和精力。为了解决这些挑战,我们提出了SUPQA,一种通过自然语言输入和交互式地理可视化输出来进行城市绩效探索的新方法。我们的方法利用大语言模型(LLM)有效地解读用户意图,并量化各种城市绩效指标。我们在可视化系统中集成了渐进式导航和多地理尺度分析,解释推理过程,并简化用户的决策工作流程。两个使用场景和评估展示了SUPQA在帮助居民和规划者更高效地获取所需信息以及提升决策质量方面的有效性。

Benchmarking Visual Language Models on Standardized Visualization Literacy Tests
随着视觉语言模型(VLMs)在可视化系统中的日益集成,深入了解它们的视觉解读能力和局限性变得尤为重要。尽管现有研究已经探讨了个别模型,但VLMs的可视化素养的系统性比较仍未被深入研究。为弥补这一空白,我们通过严格的首次评估,采用标准化评估工具——可视化素养评估测试(VLAT)和可视化素养批判性思维评估(CALVI)——对四个领先的VLMs(GPT-4、Claude、Gemini和Llama)进行评估。我们的方法独特地结合了随机试验与结构化提示技术,以控制顺序效应和响应变异性,这在许多VLM评估中常常被忽视。我们的分析表明,虽然某些模型在基本图表解读方面表现出色(Claude在VLAT上达到67.9%的准确率),但所有模型在识别误导性可视化元素方面表现出显著困难(在CALVI上的最高准确率为30.0%)。我们发现了明显的表现模式:在解读常规图表(如折线图:76-96%的准确率)和检测层次结构(80-100%的准确率)方面具有强大的能力,但在涉及多重编码的数据密集型可视化(如气泡图:18.6-61.4%)和异常检测(25-30%的准确率)方面则表现出一致的困难。值得注意的是,我们观察到各模型在不确定性管理方面的不同表现,Gemini在这一方面表现出较强的谨慎性(22.5%的问题省略率),而其他模型的省略率为7-8%。这些发现为可视化领域提供了关键的见解,建立了可靠的VLM评估基准,指出了当前模型的不足之处,并突出了在VLM架构中针对可视化任务改进的必要性。为了促进可复现性、鼓励进一步研究,并为未来VLMs的基准测试提供便利,我们的完整评估框架,包括代码、提示和分析脚本,已发布在https://github.com/washuvis/VisLit-VLM-Eval。
LayerFlow: Layer-wise Exploration of LLM Embeddings using Uncertainty-aware Interlinked Projections
大型语言模型(LLMs)通过上下文词嵌入表示单词,这些嵌入编码了语言的不同特性,如语义和语法。理解这些特性至关重要,尤其对于研究语言模型能力的研究人员、使用嵌入进行文本相似性任务的人员,或评估通过归因方法测量的标记重要性的原因。嵌入探索的应用通常涉及降维技术,将高维向量降至二维,作为散点图中的坐标。这个数据转换步骤引入了不确定性,这些不确定性可能会传播到可视化表示中,影响用户对数据的解读。为了传达这种不确定性,我们提出了LayerFlow——一个可视化分析工作区,用于显示嵌入的交互式投影设计,并传达变换、表示和解读的不确定性。特别地,为了提示潜在的数据失真和不确定性,工作区包括多个可视化组件,如显示2D和高维簇的凸包、数据点的成对距离、簇摘要和投影质量指标。我们通过复制和专家案例研究展示了该工作区的可用性,强调了通过多个可视化组件和不同数据视角传达不确定性的必要性。

An Interactive Visual Enhancement for Prompted Programmatic Weak Supervision in Text Classification
程序化弱监督(PWS)作为一种强大的文本分类技术,通过聚合手工编写的标签函数提供的弱标签,使得在大规模未标注数据上训练模型成为可能,无需昂贵的人工标注。作为一种改进,提示式PWS将预训练的大型语言模型(LLMs)作为标签函数的一部分,用自然语言提示替代专家编写的程序,从而使复杂和模糊的概念得以更易于表达。然而,现有工作流并未充分利用提示式PWS的优势,且标注者在有效地整合思想、开发高质量标签函数时遇到困难,且在迭代过程中缺乏支持。为了解决这个问题,本研究通过互动可视化改进了现有的PWS工作流。我们首先提出了一种人类与LLM协作开发标签函数的工作流,利用大型语言模型帮助人类创建结构化的开发空间进行探索,并根据人类选择自动生成提示式标签函数。标注者可以通过知情选择和判断整合自己的知识。接着,我们提出了一个互动可视化系统,支持高效开发、深入探索和迭代标签函数。通过基准测试的定量评估、案例研究和用户研究,我们的评估结果证明了该方法的有效性。

专题报告:体积数据和颜色
该专题是体积数据和颜色,会场主席是Hamish Carr,下面分享3篇工作。
Fast and Invertible Simplicial Approximation of Magnetic-Following Interpolation for Visualizing Fusion Plasma Simulation Data
我们提出了一种快速且可逆的近似方法,用于融合等离子体模拟数据,这些数据以2D平面网格表示,并在变形的3D环形空间中近似磁场线沿环向维度的连通性。在这些融合数据中,科学变量(例如密度和温度)通过一种复杂的磁场线跟随方案进行插值,该方案基于圆柱坐标系表示的环形空间。这种在3D空间中的变形给根查找和插值带来了挑战。为此,我们提出了一种新颖的可视化和分析该类数据的范式,基于一种新开发的算法,在变形的3D空间内构建3D单纯形网格。我们的算法生成一个四面体网格,通过四面体连接2D网格,同时遵循磁场线方案施加的节点连通性约束。具体来说,我们首先根据输入几何形状和连通性约束将空间划分为较小的分区,以降低复杂性。然后,我们独立地寻找每个分区的可行四面体化方案,考虑非凸性。我们通过两个国际热核实验堆(ITER)和温德尔斯坦7-X(W7-X)的X-Point Gyrokinetic Code(XGC)模拟数据集展示了我们的方法,并使用海洋模拟数据集证明了我们方法的更广泛适用性。我们的算法的开源实现已发布在https://github.com/rcrcarissa/DeformedSpaceTet。

Squishicalization: Exploring Elastic Volume Physicalization
我们介绍了Squishicalization,这是一个用于生成体积数据物理化的流程,通过物理特性——特别是通过变化其“柔软度”或局部弹性——来编码标量信息。数据物理化研究越来越多地探索多感官信息编码,特别是增强直接交互性。通过Squishicalization,我们利用物理化的触觉维度作为直接交互的一种手段。受到传统体积渲染的启发,我们将传输函数的概念进行了改编,将体积数据中的标量值编码为局部弹性水平。通过这种方式,体积标量数据被转化为雕塑,其中弹性代表物质在体积内的密度分布等物理属性。在我们的流程中,标量值引导标量场的加权采样。采样数据随后通过Voronoi镶嵌处理,创建类似海绵的结构,可以使用消费者级3D打印机和常见的打印材料进行打印。为了验证我们的流程,我们进行了计算和机械评估,并进行了两阶段的感知研究,以评估我们生成的squishicalizations的能力。为了进一步探讨潜在的应用场景,我们采访了多个领域的专家。最后,我们总结了可操作的见解和未来的应用方向。所有补充材料可以在https://osf.io/35gnv/?view_only=605e5085061f40439a98545f0c447cf3 获取。
The Geometry of Color in the light of a Non-Riemannian Space
我们正式化了薛定谔关于色相、饱和度和亮度的定义,基于赫尔姆霍兹的基础思想,即这些感知属性可以仅通过感知度量来推导。我们识别了薛定谔方法中的三个缺点,并提出了解决方案。首先,为了涵盖贝佐尔德-布鲁克效应,我们将色彩与黑色之间刺激质量的直线定义替换为感知色彩空间中的测地路径。其次,为了模拟颜色感知中的收益递减现象,我们采用了非黎曼感知度量,这引入了定义亮度时可能存在的歧义,但我们的实验表明,这种歧义并不重要。第三,我们提供了中性轴的几何定义,即在每个等亮度面内最接近黑色的颜色,这一定义只有在非黎曼框架中才可行。总体而言,我们的解决方案首次全面实现了赫尔姆霍兹的愿景:色相、饱和度和亮度的正式几何定义,完全基于感知相似度的度量,而无需依赖外部构造。
