2020年秋季学期视觉计算实验室第十四周论文研读预告

时间: 2020年12月31日(本周四) 09 : 00
地点: 望江校区基础教学楼B座318实验室
研读成员: 李龙兴 周山丰

Part1
分享者:李龙兴
分享内容
[1]Narechania A, Srinivasan A, Stasko J. NL4DV: A Toolkit for Generating Analytic Specifications for Data Visualization from Natural Language Queries[J]. IEEE Transactions on Visualization and Computer Graphics, 2020.
[2]Fu J, Zhu B, Cui W, et al. Chartem: Reviving Chart Images with Data Embedding[J]. IEEE Transactions on Visualization and Computer Graphics, 2020.

论文简介
[1]自然语言界面(NLI)在可视分析方面显示出了巨大的作用和前景,使人们可以灵活地指定可视化并与之交互。但是,开发可视化NLI仍然是一项艰巨的任务,需要同时具备自然语言处理(NLP)技术、视觉分析任务和可视化设计的知识。本文提出NL4DV,一种自然语言驱动的数据可视化工具包。NL4DV是一个Python软件包,它将表格数据集和关于该数据集的自然语言查询作为输入。作为响应,该工具包会返回一个JSON对象的分析规范,其中包含数据属性、分析任务以及与输入查询相关的Vega-Lite规范列表。NL4DV可以帮助没有NLP背景的可视化开发人员创建新的可视化NLI或将自然语言输入并入现有系统中。本文通过四个示例演示NL4DV的用法和功能:1)在Jupyter笔记本中使用自然语言呈现可视化效果; 2)开发NLI以指定和编辑Vega-Lite图表; 3)从DataTone系统重新创建数据歧义组件,以及4)结合语音输入以创建多模式可视化系统。

图1: NL4DV系统图

[2]现实世界中,图表广泛存储为位图图像。尽管很容易被人接收和理解,但它们的作用也有局限性。例如,更改图表样式、类型或图表图像中的数据值实际上需要创建一个全新的图表,这通常是一个耗时且容易出错的过程。为了完成这些任务,已经提出了许多方法来利用计算机视觉和机器学习技术从图表图像中自动提取信息。尽管他们已经取得了令人鼓舞的初步结果,但在鲁棒性和准确性方面仍然不足。在本文中,作者提出了一种称为Chartem的新颖替代方法,可以直接从根本上解决此问题。具体来说,本文设计了一种数据嵌入方法,以将大量信息编码到图表图像的背景中,而不会干扰人类对图表的感知。从图像中提取嵌入的信息后,可使各种可视化应用程序重新使用或重新利用图表图像。为了评估Chartem的有效性,作者对Chartem嵌入和提取算法进行了用户研究和性能实验。并进一步介绍了几个原型应用程序,以演示Chartem的实用性。

图2: Chartem工作流程图

Part2
分享者:周山丰
分享内容
[1]Wu Z, Pan S, Chen F, et al. A comprehensive survey on graph neural networks[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020.

论文简介
[1]近年来,深度学习已经彻底改变了许多机器学习任务,从图像分类和视频处理到语音识别和自然语言理解。然而,在越来越多的应用中,数据是从非欧几里得域中生成的,并且被表示为对象之间具有复杂关系和相互依赖性的图形。图形数据的复杂性给现有的机器学习算法带来了巨大的挑战。在这篇综述中,提供了图形神经网络在数据挖掘和机器学习领域的全面概述。同时提出新的GNN算法分类,分为五种类型GCN,GAN,GAE,GGN,GSTN。同时文章分析了网络嵌入和GNN的区别,并展示了GNN架构之间的联系。经过大量调研工作后,文章提供了丰富的GNN资源,并讲解了GNN在计算机视觉、推荐系统、交通调整、生物化学等领域的实际应用。最后文章提出了这一快速发展领域的潜在研究方向。

图3: 基于GCN构建的不同网络

123