2021年秋季学期视觉计算实验室第九次论文研读预告

时间:2021年12月2日(本周四) 09: 30

地点:望江校区基础教学楼B座318实验室

研读成员:陈富秋 郭睿明

Part1

研读成员:陈富秋

分享内容

[1]Guo S, Jin Z, Chen Q, et al. "Visual anomaly detection in event sequence data." 2019 IEEE International Conference on Big Data (Big Data). IEEE, 2019.

[2]Guo, Shunan, et al. "Interpretable Anomaly Detection in Event Sequences via Sequence Matching and Visual Comparison." IEEE Transactions on Visualization and Computer Graphics (2021).

论文简介

[1]异常检测是一项常见的分析任务,其目的是识别数据集中偏离正常情况的罕见案例。当进行事件序列数据的分析时,异常检测的任务可能变得更加复杂,因为这类数据的顺序性和时序性导致异常的定义多样、形式灵活,这在一定程度上也增加了解释异常检测结果的难度。本文提出了一种基于变分自动编码器(VAE)的无监督异常检测算法,通过计算事件沿序列进程的发生概率来评判序列的异常程度。本文开发了一个可视分析系统EventThread3,借助一对多的序列比较,用于交互式地探索并分析异常检测结果的正确性与可信性。最后,本文定量地评估了提出的异常检测算法的性能,并通过电子健康记录数据验证了系统的有效性。

图1:EventThread3系统概览

[2]本文是针对上述文章的延续性工作,研究场景仍然是事件序列数据的异常检测。相较于此前的工作,有3点补充与完善:(1)改进了序列的异常检测算法,使用Kuhn-Munkres配对算法,以实现更加灵活的序列比对,并新增了异常事件的类型定义;(2)优化了系统的视图设计:基于聚类的事件序列聚合和基于矩阵的事件序列可视化,进一步提高了正常序列与异常序列的比较结果;(3)通过电子健康记录数据验证了系统的有效性,并收集了专家访谈结果;新增职业发展路径数据测试系统,证明研究成果的可迁移性。

图2:异常检测可视分析的完整流程

Part2

研读成员:郭睿明

分享内容

[1]Liu Z , Lin Y , Cao Y , et al. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows[J]. 2021.

[2]Gao S , Cheng M M , Zhao K , et al. Res2Net: A New Multi-scale Backbone Architecture[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2019.

论文简介

[1]Transformer是在自然语言处理领域大获成功的RNN模型,并且在计算机视觉任务中也表现出优异的成绩。但是,相较于文本,视觉实体的尺度变化更大、分辨率更高等特点,都给Transformer的在计算机视觉上的应用带来了挑战。为了解决此问题,作者提出了一种层级化的Transformer网络,并使用Shifted Windows(简称Swin)方法进行representation的计算。模型中的Windows将自注意力的计算限制在不重叠的局部窗口中,而Shifted Windows能实现跨窗口信息连接。网络的层级特征提取使得网络能够适应多种尺度的视觉目标,并且Swin的计算相对输入图像大小只有线性时间复杂度。以Swin Transformer作为骨干网络的模型在多个计算机视觉任务中取得了SOTA的成绩。

图3:(a)Swin-Transformer模块架构;(b)Swin Transformer块内部结构

[2]图像中往往存在着多尺度的物体,准确表述多尺度物体的特征对多种计算机视觉任务有着重要的意义。现有方法对多尺度信息的处理仅停留在神经网络的层级之间,而本文设计了残差网络中的残差网络,通过层内的跨越连接,在粒度级表征多尺度图像特征,增大了神经网络中每一层的感受野,提升了每一层提取多尺度信息的能力。Res2Net骨干网络可以用来替换现有的SOTA骨干网络,以在计算机视觉各大任务中取得超过基线水平的效果。

图4:(a)GoogLeNet中的bottleneck模块;(b)作者提出的Res2Net模块