ChinaVis 2020 线上会议 —— 下午

ChinaVis 2020会议7.19日下午的议程由六个论文报告专题组成:多维数据可视化、可视分析、可视化设计、可视化与可视分析应用、新冠与可视化叙事,以及可视化与交叉学科;每个专题有4-5篇相关论文分享。

Paper Session3 多维数据可视化

记录者:李长林

1.SemanticAxis: Exploring Multi-attribute Data by Semantics Construction and Ranking Analysis

3.1-1
分享者:李泽宇 天津大学

  1. 提出semanticAxis语义轴,基于对比分析思想的多属性数据分析技术,将结果的理解和多维属性排序结合到同一个探索环境中。
    a) 语义轴的构造:选择两组点,将两组点的中心连接形成语义轴向量。
    b) 语义轴的用处:1. 解释降维数据分布的不同差异,2. 多属性数据的排序
  2. 设计了一个以语义轴为核心的可视分析系统,证明了语义轴的有效性,扩展了丰富的交互,使其能够应用于多种复杂的应用场景。

提问:

  1. 如何解释非线性语义?通过向量表示,严格上不能准确表示具体的语义,但是可以表示接近于某个近似的属性。
  2. 如何设置权重?可以在语义轴的不同子向量上单独设置权重,使得不同的因素对结果的影响程度不同

2.A Visual Uncertainty Analytics Approach for Weather Forecast Similarity Measurement based on Fuzzy Clustering

3.2-1
分享者:黄仁培 清华大学
提出相似性不确定性造成检索和度量精度下降的相关问题的解决方案

  1. 不确定性提取模块
    a. 通过模糊聚类的隶属度矩阵表征相似性的不确定性
    b. 最大化维度区分能力的权重自适应
  2. 可视分析模块
    a. 矩阵-维度密度矩阵视图:展现相似性不确定性分布
    b. 聚类过程视图:可视化数据总体不确定性变化
    提问:
  3. 对于气象领域之外的其他领域的拓展性?所涉及的不确定性提取模块对于任意给定的高维标量数据集都适用
  4. 可视化设计过程迭代?整个设计过程中都是和专家一点点讨论得到的。

3.数值型关联分析中连续属性的探索式离散方法研究

3.3-1
分享者:吴帅 合肥工业大学

  1. 数值型关联分析常见做法
    a) 对连续属性进行分区,将分区后的结果转化为布尔型关联分析进行处理。
  2. 数值型关联分析中关键问题及解决方案
    a) 子区间支持度、置信度
    b) 初始区间的划分——遗传算法
    c) 过分割策略、合并原则——最小支持度原则、相邻合并原则、置信度相近原则
  3. 可视化设计
    a) 基于散点图的规则概览图——规则的挑选
    b) 基于弦图的子区间关联视图——规则的过滤
    c) 基于散点图的规则评估视图——规则的评估
    提问:
  4. 数据集的案例分析?有三种包括交通事故违法在内的公开数据集等取得了比较好的结果。

4.Exploring Visual Dimension Analysis Based On Dimension Subdivision

3.4
分享者:余晨熙 天津大学

  1. 提出了一种维度细分方法,可以进行多尺度维度相关性研究并分析多维数据。
    a) 维度相关性分析——皮尔森相关性分析以及重叠度计算
  2. 为维度细分结果设计合适的可视化
    a) 合成的数据集——维度相关性越大,节点距离越近
  3. 开发了可视化系统以帮助多尺度维度分析

提问:

  1. 什么样的结构值得细分?根据散点图拟合的直线计算均值RMSR,值越小越接近线性结构,值越大越接近团状结构,根据差异大小判定是否值得细分。

5.面向分析任务的表格数据可视化交互构建

3.5
分享者:马楠 北京大学

  1. 利用可视化语言描述数据处理操作可视化通道映射,可视化形式。
    a) 数据聚和——依据用户需求将数据进行聚和,生成统计图表、
    b) 属性树——记录用户的历史探索路径,扩大搜索时数据属性的覆盖范围
  2. 面向不同的数据分析人物及参考可视化分析任务,推荐可视化及见解。
  3. 利用交互式可视分析系统,提高数据覆盖率,保留用户的探索路径,结合上下文生成可视化推荐

提问:

  1. 自动化推荐算法?对于合理的可视化推荐是会展示的,但没有做排序。

Paper Session4 可视分析

主持人:曾伟
本专题介绍了ChinaVis2020录用的五篇可视分析相关的论文。
记录者:温啸林

1.EcoLens: Visual Analysis of Ecological Regions in Urban Contexts Using Traffic Data

4.1
分享者:Zhuochen Jin 同济大学
该文章研究了一种基于非负矩阵分解的算法(用于揭示城市中人群移动模式区域性动态演变)和一个基于现实设计需求的可视分析系统(用于解释人群移动模式及其演变过程),帮助分析人员使用交通数据逐步探索分析城市区域划分随时间的动态变化结果。

2.Visual Analysis of Meteorological Satellite Data via Model-Agnostic Meta-Learning

4.2
分享者:程世宇 中国科学院大学
基于模型无关元学习的气象卫星数据可视分析,分地面站数据训练、卫星数据处理、训练回归模型、分析全球气象变化四个步骤对卫星气象数据进行深入分析。

3.文献聚类结果可视分析方法研究

4.3
分享者:余晓敏 中国科学院大学
针对无标签文献数据提出了文献聚类结果可视分析框架。该框架将文献聚类各个环节解耦、统一数据形式以支持用户探索各个环节采用不同方法对聚类效果的影响,同时涉及了文献聚类结果可视分析方案,以支持聚类结果的解释、评估、分析、调整和优化。基于该框架设计是西安了文献聚类结果可视分析系统,并通过三个案例验证了该框架的有效性。

4.IVDAS: An Interative Visual Design And Analysis System for Image Data Symmetry Detection of CNN Models

4.4
分享者:韩晓阳 中国科学院大学
提出一个带有处理内核的CNN模型和一个基于CNN模型的图像对称性检测的交互式可视化设计和分析系统,解决了生物分子图像识别相关问题。

5.SensorAware: Visual Analysis of Both Static and Mobile Sensor Information

4.5
分享者:魏大同 北京大学
提出了一个交互式探索传感器时空数据的可视分析系统,帮助用户高效分析移动和静态的传感器数据,发现异常情况或隐藏模式。

Paper Session5 可视化设计

记录者:刘尚松
此专题包含五篇与可视化设计相关的论文报告。

1 Reverse-engineering Bar Charts Using Neural Networks

51-1

图5.1 使用神经网络的逆向工程柱形图工作流程
Author: Fangfang Zhou, Yong Zhao, Wenjiang Chen, Yijing Tan, Yaqi Xu, Yi Chen, Chao Liu, Ying Zhao

本文主要研究三个内容:基于目标检测的文本提取方法、基于编码器-解码器结构和视觉注意力机制的数值提取方法、设计实现柱形图的逆向工程方法。基于目标检测的文本提取模块使用faster-RCNN实现目标检测模型合并定位和分类过程,使用Tesseract OCR实现文本识别;基于编码器-解码器的数值提取模块使用Xcpetion深层卷积神经网络作为编码器,使用LSTM循环神经网络作为解码器,并引入注意力模型提高数值提取准确率。

2 A New Nonlinear Dot Plots Visualization Based on Undirected Reassignment Algorithm

52

图5.2 基于无向重分配算法的新型非线性点图可视化
Author: Yun Xiao, Changqing Wang, Kang Li, Baoying Liu, Jun Guo, Wei Wang

为了解决列位置和自适应点大小的问题,我们提出了一种基于无向重新分配算法的改进的非线性点图。改进后的非线性点图可以对数据进行处理和赋值,从而获得一个能够呈现合适的点位置和数据分布的优化布局。该方法结合了非线性点图的优点,能够适应大范围、高频率的可视化数据集样本,并能方便地发现数据变化趋势和数据列之间的离散性。未来的工作将包括测试算法,以找到额外的数据规则,并使用其他模式图形变体来发现属性相关性。

3 Colormap Optimization with Data Equality

53

图5.3 数据均等性的色彩图优化
Author: Xiaohui Wang, Jiawei Yin, Bowen Cheng, Jingyan Qin

颜色映射优化的任务是找到一个合适的颜色映射函数f:D->C,将数据值D映射到颜色空间中的颜色集C,但对于所有数据集,没有最佳的颜色映射。本文提出了一种基于弹簧模型的颜色映射,可有效揭示数据分布并识别数据值,它为动态平衡弹簧系统制定了比例规则和数据墨水规则。通过眼动跟踪实验验证了该方法的有效性,结果表明该方法在数据分布显示和数据值识别方面都有较好的表现。

4 面向数据可视化的色彩计算

54

图5.4 色彩图优化(最右侧是该方法)
Author: Qiong Zeng, Yunhai Wang, Changhe Tu, Baoquan Chen

报告从文章的研究背景、色彩设计准则及其量化表达、自动色彩设计、自适应色彩设计、总结与展望五个方面展开。数据可视化中的色彩感知是主客观相互博弈的过程,未来的研究主要有三个方面:基于数据、任务、用户和设备,探索精细的颜色感知模型和颜色设计指南;基于应用属性的共性色彩设计构建效果评价;自适应更新颜色设计,实现高效交互和可视化理解。

5 A Survey on Automatic Infographics and Visualizaiton Recommendation

55

图5.5 自动信息图表和可视化推荐综述
Author: Sujia Zhu, Guodao Sun, Qi Jiang, Meng Zha, Ronghua Liang

该报告介绍了自动信息图表生成、可视化图表推荐的宏观背景,讲述了普遍的框架和流程,具体介绍了数据驱动、基于知识、混合模式三种方法,最后提出了该领域的挑战。本文还从数据源、模型、是否可交互、是否使用ML、是否支持排序、设计空间、输入和输出几个方面总结了当前的多个相关研究。

Paper Session6 可视化与可视分析应用

记录者:杨啸

1. ConfVisExplorer: A Literature-based Visual Analysis System for Conference

6.1

图6.1 自动信息图表和可视化推荐综述

作者: Kaixin Chen, Yang Wang, Minzhu Yu, Hanwei Shen, Guihua Shan
在不同的学术会议中,对于会议组织者来说难以了解到每个作者的情况。对于参会者来说,难以快速得知各个会议的概念及差异。同时如何客观公平地选择合适的审稿人也是一个巨大的挑战。文章针对会议的特点对现有的框架进行了改进,从会议起源,作者,机构出版物内容和影响六个方面对会议的成熟度进行评估,形成了一个完整的会议成熟度评价框架。同时设计了一个可视化交互系统让用户可以探索自己感兴趣的内容。

2. 面向京剧剧本的文本可视化设计与研究

6.2

图6.2 京剧剧本可视化

作者:Bo Zhang, Wenjun Hou
现有的关于京剧的研究大都将研究点放在如何将京剧作为一种元素应用到当代的生活中。表现京剧内部关联信息的研究较为少见。论文从京剧剧本的角度入手,展示了剧本内和剧本间之间的关联关系。可以通过交互了解京剧的现状,帮助分析者理解京剧剧本,有益于对京剧文化的传播。

3. Visual Exploration of Urban Functional Zones Based on Augmented Nonnegative Tensor

6.3

图6.3 可视化城市功能区
作者:Liyan Liu, Hongxin Zhang, Jiaxin Liu, Shangqing Liu, Jiaju Man, Wei Chen 城市根据社会经济活动的不同可以划分成不同的区域。一方面,功能区可以帮助人们理解复杂的城市,而且有利于城市规划。另一方面对于商业选址,交通管理也十分有用。本文作者基于移动数据和POI数据发现城市功能区。基于路网划分,应用主题模型确定城市功能区。

4. FaultTracer: Interactive Visual Exploration of Fault PropagationPatterns in Power Grid

6.4

图6.4 电网异常检测
作者:Tianye Zhang, Zexian Chen, Zhe Zhao, Xiaonan Luo, Wenting Zheng, Wei Chen

电网可以抽象成一个网路结构。在这个网络结构中,节点代表了母线,用于生产、收集和分配电能。网络间的链接代表了母线之间的一个传输线路。当电网中的某个节点发生故障时,这个故障会随着网络结构在电网中不断地传播,导致与这个节点相邻的一些节点都会收到故障的影响。本文基于电网仿真数据,提出了一种改进后的基于统计质量控制的异常检测算法,用于衡量和评估这个故障。同时设计了一个可视分析系统研究故障的传播规律。

5. 面向无线电监测与管理的可视化技术综述

作者:Fangfang Zhou, Huixuan Xie, Xiaobo Luo, Ying Zhao, Jian Liu, Qiang Wei, Fanglin Gu
21世纪以来,随着无线电通信设备和应用的爆发式增长,导致一些主动和被动信号被非法干扰或频谱被占用的现象频繁发生。同时,随着扩频,跳频等技术广泛使用,无线电通信行为越来越复杂。因此,如何帮助无线电管理人员实现高效的无线电行为分析与无线电监管成为一个十分重要的问题。文章从科学可视化、可视分析、协同分析三方面梳理了相关研究和技术应用。

Paper Session7 新冠与可视化叙事

记录者:张馨艺

1.新冠肺炎疫情数据多维度可视分析方法

image-20200719183057389
分享者:刘建湘,信息工程大学
本文主要采用递进式分析方法(SFPF),基于河南省广播电视台的真实需求,对河南省新冠肺炎疫情数据进行可视分析,主要包括疫情态势感知、来源分析、传播模式分析以及趋势预测等四个功能模块。疫情态势感知结合时间轴插件进行交互分析;来源特征分析可以看到大部分病例来自武汉;传播模式分析结合地图和病例知识图谱探索式发现病例的传播方式,进而总结疫情传播模式;趋势预测通过交互设置SEIR模型参数对疫情进行预测。本文工作数据来源于丁香园、国家卫健委以及百度迁徙大数据三个平台。

2. DancingWords: Exploring Animated Word Clouds to Tell Stories

image-20200719185049569

分享者:Xinhuan Shu,香港科技大学
该论文获ChinaVis2020最佳论文提名奖,工作主要包括总结故事叙述的基本要素、设计动态词云、总结动态词云的设计原则、扩展设计空间、评估和分析等多个流程。通过一系列探索性研究提出了基于动态词云叙事可视化的设计空间,并进一步开发了原型创作工具 DancingWords,提出了将词云与动画结合来进行数据叙事的方式。未来工作会考虑应用先进的自然语言处理的算法,来自动的提取故事中的关键词,提高工具的可用性,以及进一步的把工具部署出来。本文工作可在GitHub上找到:dancingwords.github.io。

3. 传染病传播数据可视化综述

image-20200719190237855

分享者:陈晓慧,信息工程大学
近年来,各类恶性传染病频发,传染病传播数据可视化发挥了重要作用。该综述对传染病传播数据的分析进行了详细阐述,包括传染病传播过程建模方法、传染病传播数据可视化方法、传染病传播数据可视分析任务分类与归纳等三个方面。传染病传播过程建模方法包括SIR模型、SEIR模型等;传染病传播数据可视化方法可以分为基于地图的可视化方法、基于时空立方体的可视化方法、基于时序的可视化方法以及基于关系的可视化方法,从数据属性特征和分析任务出发,对传播数据可视化方法的分类和总结如图所示;传染病传播可视分析任务主要包含时空分布可视分析、关联因素可视分析、趋势预测可视化等三个方向。

4. Bubble Storytelling with Automated Animation: A Brexit Hashtag Activism Case Study

image-20200719192812636
分享者:陆俊华,浙江大学
该论文以英国脱欧标签激进主义案例研究为例提出了一个自动动画的气泡叙事可视化原型系统,通过自动插入互动动画来增强气泡图用以叙事。系统设计了高亮、减速以及暂停等三种动画效果来辅助叙事,具体体现在高亮移动程度较快较高的标签、减速移动在前后两个不同阶段相差较大的标签以及对大量标签聚集的情况提供暂停效果。它在视觉化过程中减少了人类的负担。所提出的系统不仅有助于探索数据模式的变化,而且有助于得出结论。

Paper Session8 可视化与交叉学科

主持人:刘日晨 北京大学
本专题介绍ChinaVis2020录用的几篇可视化与交叉学科的论文。
记录者:胡浩

1. 深度学习驱动的可视化

8.1
分享者:刘灿 北京大学 可视化与可视分析研究组
一篇关于深度学习驱动的可视化的综述。近年来,深度学习在可视化领域有着广泛的应用,使用深度学习驱动的可视化能学习人类认知与行为模式,从而减轻可视化用户的负担。作者将搜集到的相关论文,按可视化不同阶段,分类为由深度学习驱动的压缩表征、可视化快速构建、可视化智能交互、可视化结果评估以及可视化中的智能自然语言交互,分别加以论述并提出相关挑战。

2. Photo4Action: Phone Camera-based Interaction for Graph Visualizations on Large Wall Displays

8.2
分享者: 陈帅 北京大学
该研究涉及一种更有效的大屏交互方法。大屏可视化能提供更多的展示空间,但传统的交互方式效率较低。该研究提出一种通过手机拍照与大屏可视化交互的方法,用户用户只需要对感兴趣的区域拍照即可实现大屏中的定位,并进行后续的交互,具有简单易用的特点。

3. An Automatic Tooth Reconstruction Method Based on Multimodal Data

8.3
分享者: 钱驾宏 博士 浙江大学CAD&CG实验室
完整准确地从医学体数据中抽取得到3D牙齿模型对后期诊断非常重要,完整的牙齿模型可以从不同的医学成像中获取。作者针对CBCT成像中存在的噪音、分辨率较低、牙齿交错处难区分的不足,提出一种改进的面向多模态数据的自动化牙齿重建算法,使牙齿模型更完整准确。

4. Classification of 3D Terracotta Warriors Fragments Based on Geospatial and Texture Information

8.4
分享者: 杨康 西北大学 信息科学与技术学院
兵马俑碎片分类是兵马俑修复的前期工作,能否高效准确地分类将会影响对文物的修复效果。目前对碎片分类的方法主要还是依靠人工,该研究作者借助深度学习的技术,提出一种基于空间和纹理信息的3D兵马俑碎片分类方法,提高分类的效率。