数据可视分析挑战赛
报告者: 挑战赛一等奖和二等奖的参赛队伍
报告内容:
数据可视分析挑战赛是中国可视化与可视分析大会的一个重要环节。挑战赛邀请研究人员、开发人员和爱好者使用他们最有效的可视分析技术和工具来完成数据分析任务。挑战赛旨在帮助研究人员、开发人员和爱好者评估他们的技术和工具在解决复杂问题中的有效性和新颖性,并促进我国可视化与可视分析相关研究与应用的发展与进步。
报告中,张慧杰教授对挑战赛的筹备、发布、评审等过程的细节,赵颖副教授对历年的参与及获奖情况进行了总结,表示若非疫情影响ChinaVis挑战赛应当处于飞速发展阶段,大家都对下一届挑战赛充满期待。接着,挑战赛一等奖和二等奖的队伍对其获奖作品从选题、数据、方法、思路、分析结果等多个方面进行报告。值得一提的是,答疑环节同学向企业参赛队伍的产品经理请教关于如何提升用户体验,发人深思。最后,举行了颁奖典礼,大会挑战赛委员会专家将奖状颁发给获奖队伍并合影留念。
另外,在本次挑战赛中,由四川大学视觉计算实验室的五位小伙伴组成的队伍提交的“基于微博数据的疫情可视分析系统”荣获挑战赛优秀奖,获奖证书如图所示。
新颖交互与设计
报告者: 俞凌云,西交利物浦大学 助理教授,博士生导师
报告题目: 用于三维可视化的交互技术与界面
交互技术对于数据可视化过程至关重要。对于复杂的3D可视化数据集,交互任务的实现变得更具挑战性。讲者首先介绍了基于触摸/笔式交互、Tangible交互、手势交互、混合交互的解决方案,并对比了这些技术之间的优缺点。
针对需要高精确度的漫游、选择、注释等交互需求,讲者结合交互任务和界面两方面,以发表在IEEE TVCG的 LassoNet: Deep Lasso-Selection of 3D Point Clouds 和 CAST: Effective and Efficient User Interaction for Context-Aware Selection in 3D Particle Clouds 两篇论文的工作为例,详细讲解了在揭示用户探索意图的3D交互技术上的研究工作。具体内容如下:
以往对3维数据的选择方法的研究主要是基于局部点密度等启发式方法,从而限制了它们在一般数据中的适用性。在 LassoNet 的工作中,讲者的团队设计了一种新的Lasso网络,它是一种用于Lasso选择三维点云的深层神经网络,试图从视点和Lasso学习到点云区域的潜在映射。在评估方面,作者进行了一项正式的用户研究,将LassoNet与两种最先进的Lasso选择方法进行比较。 评估证实,该方法提高了三维点云、视点和套索选择的不同组合的选择有效性和效率。
而在 CAST 的工作中,通过新的上下文感知算法提高了点云空间选择的可用性和速度。 它们能够从手势输入中推断出用户微妙的选择意图,能够处理部分遮挡点簇或多个簇层等复杂情况,并且都可以在选择交互完成后进行微调。在评估方面,通过用户研究证实了使用该方法在点云空间中进行数据选择的速度有显著提高,而精确度没有损耗。
报告者:傅四维,之江实验室
报告题目:Quda: Natural Language Queries for Visual Data Analytics
近年来,面向可视化的自然语言界面(V-NLI)在可视化社区中吸引了广泛的关注。而目前V-NLI中面临的两个方面的问题,一是如何作出有效的设计决策,这依据于经验研究,从查询中抽取出用户分析任务;二是理解自由形式的自由语言。因此,从自由文本中识别分析任务对于制定V-NLI至关重要。此外,基于学习的方法在V-NLI中显示出潜力,并在各种NLP任务中达到了最先进的性能。 但是,由于缺乏足够的训练样本来满足视觉数据分析的需要,因此很少采用尖端技术来促进V-NLI的发展。
基于此,讲者团队提供了一个名为Quda的新数据集,该数据集旨在通过训练和评估前沿的多标签分类模型来帮助V-NLI从自由形式的自然语言中识别分析任务,以帮助V-NLI理解自由形式的自然语言。该数据集包含14035个不同的用户查询,每个查询带有一个或多个分析任务,讲者团队共定义了10个低级分析任务,可帮助部署用于解析复杂人类语言的最新技术。Quda首先基于V-NLI的目标用户数据分析师收集种子查询, 然后通过大量的众包工人进行释义的生成和验证来实现此目标。评估方面,通过创建原型为自由格式用户查询做出有效的设计决策,展示了Quda在构建V-NLI方面的有用性。此外,讲者还通过分析学术出版物中描述的设计任务,认为Quda可以在可视化社区中的广泛应用中受益,希望它将促进V-NLI在数据分析和可视化方面的研究和开发。
专题报告6: 金融可视分析
报告者: 李权,微众银行 高级研究员
报告题目: 金融风控全流程可视分析及实践
金融风控全流程可视分析包括贷前管理、贷中管理、贷后管理,通过风控策略回溯及用户画像评分,挖掘更有价值的决策特征,预防潜在风险。在贷前可视化中通过机器学习建模、模型训练可视化、以及数据探索可视化判断一个人是否需要贷款进行精准投放,贷中可视化主要应用于风控策略和反欺诈监控,贷后可视化主要应用于风控策略回溯及用户画像分群。最后,讲者细致介绍了可视化分析在上述应用的实践案例及新产品挖掘以及企业内控。
报告者: 岳轩武,创新工场人工智能研究院 研究员
报告题目: “金融可视化”的研究与落地
讲者首先提出金融可视化目前已有的研究成果较少,主要由于存在主题方向少、连续工作少、数据隐秘性等限制以及金融数据具有大量且多样性的特性等挑战。其次讲者推荐了金融可视化在工业界及学术界的待研究工作以及讲者在金融可视化方向上的研究计划及正在解决的问题。
报告者: 牛之彬,天津大学智能与计算学部 助理教授
报告题目: 可视分析点亮智能金融监督
国内外金融行业经历了传统金融、互联网金融、科技金融到智能金融的变迁,人工智能是新一代金融科技的关键技术,但在金融创新与安全可控间仍然存在失衡。引入可视化与可视分析技术后,监管科技和金融科技从以客户为中心转变成为以数据为中心的理念,讲者介绍了可视化在金融行业智能预警与风险防控等方向的相关工作与思考。
专题报告8:城市与时空分析
报告者: 颜建强,西安市交通信息中心 正高级工程师
报告题目: 智慧交通大数据可视化应用与研究
城市居民每日出行产生大量的交通数据,如何让这些数据变的可应用、可理解,服务管理和决策,可视化技术非常重要。颜建强工程师以自己所负责的“西安市综合交通信息服务平台”为例,解读交通大数据可视化技术,全面展示公交、出租、客运、货运、公共自行车、停车、地铁、民航、公路、铁路等领域的可视化应用研究成果,并提出智慧交通未来将会愈来愈趋向于智能化、三维化的发展趋势。
报告者: 李杰,天津大学 副教授
报告题目: 范式指导的可视设计——以时空分析为例
当前各类新的可视化方法层出不穷。海量的数据与复杂的分析问题使得可视化系统愈发复杂。如何保持可视化系统的简单易用变得非常困难,在时空分析中,这一问题变得更加明显。时间和空间增加了数据的维度,使得分析人员需要在连续时空中开展各类分析任务。本报告以时空数据为例,探讨如何通过构建时空探索范式设计可视化系统,使得在面对复杂数据结构时,可视化系统依然具有很好得可用性。 作者首先介绍了他构建语义时空立方体的工作(Semantics-Space-Time Cube)在时空文本中的分析中的应用。作者以社交媒体数据为例进行了阐述。作者表示,带有时间空间标记的社交媒体文本是超大规模的非结构文本,地理空间和网络空间信息的结合形成了复杂的分析任务。用户可能希望了解(S,T,P)空间及其子空间下的热度以及具体的讨论内容。因此,作者提出的语义时空立方体,在时空维度的增加了语义维度,融合了讨论内容及热度信息,从而允许用户在任意维度切片下执行多样化的分析任务。作者还针对该语义时空立方体开发了可视化探索分析系统,实现了在平面中对3D立方体的模拟,支持对空间、时间及主题维度下的分析。
接下来,作者介绍了其在交互式时空贡献关系探索分析方面的工作COPE。在实际场景中,共现关系的表现可能是多样性的例如多属性间同时出现极值、共现关系可能存在时间差及共现关系可能发生在不同类型的数据当中等。针对上述问题,作者将共生模式探索定义为寻找满足特定谓词的relevant events(taking the maximum/minimum),并定义了5种时序关系(the same time、after/before with fixed Δt,after/before)及共生模式强度,通过设计时间抽取器、事件视图及共生探索器来支持用户对共生模式的交互式探索分析。
专题报告9:智能教育与可视化
报告者:武亚强,联想研究院 智慧教育研发总监
报告题目:智能时代下的未来教育
智能技术将进一步与教育教学深度融合,衍生出全新的智能化创新场景,正从原有的教育信息化的支撑角色,朝着创新、引领的角色转变。讲者强调人本主义思潮正在反思科学主义思潮。用“智能+”赋能教育,“教师减负是关键,学生关爱是过程,因材施教是目标”。讲者介绍了多个应用案例:通过智慧阅卷(如文本识别高亮文章修辞手法)、智能知识导航(知识图谱+学科资源)、听力辅助学习(高亮对错)、VR/AR授课等解决方案,人工智能将成为最出色的教师助手,帮助千万教师从日常担负的海量重复性工作中解放出来。人工智能将与教育科学深度结合,通过优化人工智能算法在教育场景的落地应用和面向全过程、多维度、细粒度的教学支持,带来大规模高品质的智慧教育,为教师、学生、家长、管理者减负增效。最后,讲者提出数智教育的未来展望是AI+Edge+5G+VR/AR。
专题报告11:可视化与人工智能
报告者:李权,微众银行
报告题目:促进人、机器技术及数据的互联互动——以游戏体验及社交媒体为例
可视化方法用于提高机器学习方法的可解释性和可信度主要分为:1)用于数据理解的可视化方法、2)用于模型效果提升的可视化方法、3)用于部署和管理的可视化方法。具体而言,这些方法关心模型为何起作用、为何失效、对于何种数据起作用、对于何种数据失效等问题。在可解释性机器学习的背景下,作者以游戏体验及社交媒体为例,讲述了人、机器技术及数据的互联互动。
在游戏体验领域中,作者的工作将改善游戏体验的焦点定为在了改善游戏设计上,发现一个用于分析snowballing和comeback原因的可视系统是有必要的。作者开发了一个配套的交互可视技术来协助从游戏数据中进行知识挖掘和意义建构,帮助了领域专家探索snowballing和comeback发生的多种因素。该模型从单场游戏中得到的结果来探索大量游戏中的适用模式。
在社交媒体领域中,针对如何预测社交媒体帖子的流行趋势,并了解影响帖子流行的因素,现有的预测模型要么依赖于繁琐的特征工程,要么依赖于复杂的参数调优,这很难理解和改进。 在此背景下,作者研究和增强了一个基于点过程的模型,通过结合视觉推理来支持用户与预测模型之间的通信,以获得更好的预测结果。该系统支持用户揭示模型背后的工作机制,并根据所获得的洞察力相应地提高预测精度。在该工作的最后,作者使用现实的WeChat文章来演示系统的有效性,并在大规模的WeChat文章中验证改进的模型。
报告者:王韵,微软亚洲研究院 主管研究员
报告题目:可视化信息图表的自动设计研究(AI-Powered Design of visualizations and infographics)
数据可视化信息图通过对数据进行可视表达和艺术设计,让数据故事变得引人入胜,进而达到有效沟通的目的。然而,设计和制作数据信息图并不容易。要设计好的数据信息图,需要对数据有深入的理解,并且在此基础上进行视觉设计,需要花费大量的时间。讲者列举了三个案例介绍自己在自动设计信息图表领域的研究,包括1)如何自动抽取可拓展的时间线模版(Timeline);2)如何实现数据信息图表的自动生成(Text-to-Viz);3)如何自动化地抽取数据事实和数据故事(DataShot)。以案例二为例,Text-to-Viz能通过输入一句话,输出优质的图像,可用于辅助PPT制作、出版物配图等,其具体流程如下:将文本数据进行语义解析,所获得的语义细节用于视觉生成,然后对视图进行选择和修正,即考虑视图的语义、信息和视觉三个指标,并对候选可视化视图进行排序。最后,讲者还探讨了AI技术在信息图表设计的展望和挑战。如今高质量的可视化设计和视图在快速增长,如何理解和重用现存的优质可视化值得大家思考。