时间:2022年9月29日(本周四) 09: 30
地点:望江校区基础教学楼B座318实验室
成员:姜磊、古名扬
Part1
分享者:姜磊
分享内容:
[1] H. Huang et al., "UNet 3+: A Full-Scale Connected UNet for Medical Image Segmentation," ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020.
[2] Ren, S., He, K., Girshick, R., and Sun, J., “Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks”,arXiv e-prints, 2015.
论文简介:
[1] 最近,对基于深度学习的语义细分的兴趣日益增长。 UNet是具有编码器架构的深度学习网络之一,广泛用于医学图像分割。组合多尺度特征是准确分割的重要因素之一。 UNet ++是通过设计带有嵌套和密集的跳过连接的体系结构来开发的。但是,它没有从全尺度探索足够的信息,并且仍然有一个很大的改进空间。在本文中,我们提出了一种新颖的UNet 3+,它利用了全尺寸跳跃连接和深度监督。全尺度跳跃连接结合了低尺度细节,以及来自不同尺度的特征地图的高级语义;深度监督从全尺度的聚合特征图中学习层次结构表示。提出的方法特别受益于出现在不同尺度的器官。除了准确的改进外,提出的UNet 3+还可以降低网络参数以提高计算效率。我们进一步提出了混合损失函数,并设计了一个分类引导的模块,以增强器官边界并减少非器官图像中的过度分割,从而产生更准确的分割结果。在两个数据集上证明了该方法的有效性。
[2] 最新的目标检测网络取决于区域建议算法来假设目标位置。 SPPNET 和FAST R-CNN 等进步减少了这些检测网络的运行时间,但是区域建议算力却成为了性能提升的瓶颈。在这项工作中,我们介绍了一个区域建议网络(RPN),该网络与检测网络共享全图像卷积特征,从而实现了几乎无需成本的区域建议。 RPN是一个完全卷积的网络,可以同时预测每个位置处的对象界限和对象分数。 RPN经过训练良好的端到端,以生成高质量的区域建议,该建议被快速R-CNN用于检测。我们通过共享其卷积特征将RPN和快速的R-CNN合并为单个网络,即使用“注意力”机制的最近流行的神经网络术语,RPN组件告诉统一网络在哪里寻找。对于非常深的VGG-16,我们的检测系统在GPU上具有5FPS(包括所有步骤)的帧速率,同时在Pascal VOC 2007、2012和Pascal VOC上实现了最新的对象检测准确性MS COCO数据集,每个图像只有300个建议。在ILSVRC和COCO 2015年的比赛中,Faster R-CNN和RPN是赢得赛道任务第一名的基础。
Part2
分享者:古名扬
分享内容:
[1] Wu A , Wang Y , Shu X , et al. AI4VIS: Survey on Artificial Intelligence Approaches for Data Visualization[J]. IEEE Transactions on Visualization and Computer Graphics, 2021.
[2] Cao Y R, Li X H, Pan J Y, et al. VisGuide: User-Oriented Recommendations for Data Event Extraction[C]//CHI Conference on Human Factors in Computing Systems. 2022: 1-13..
论文简介:
[1] 可视化本身已成为一种数据格式。与文本和图像等其他数据格式类似,可视化越来越多地与人工智能 (AI) 技术一起创建、存储、共享和(重新)使用。在本次调查中,我们探讨了将可视化形式化为一种新兴数据格式的基本愿景,并回顾了将 AI 技术应用于可视化数据 (AI4VIS) 的最新进展。我们将可视化数据定义为计算机中可视化的数字表示,并专注于数据可视化(例如图表和信息图表)。我们基于跨越计算机科学十个不同领域的语料库进行调查,着眼于确定重要的共同兴趣。我们生成的分类法围绕什么是可视化数据及其表示、为什么以及如何将 AI 应用于可视化数据进行组织。我们重点介绍了研究人员应用于可视化数据的一组常见任务,并详细讨论了为完成这些任务而开发的 AI 方法。根据我们的文献回顾,我们讨论了围绕可视化数据的管理和利用的几个重要研究问题,以及人工智能在支持这些过程中的作用。我们在 ai4vis.github.io 上在线提供了调查论文和相关材料的列表。
[2]数据探索系统已成为流行的工具,数据分析师和其他人可以使用这些工具探索原始数据并组织他们的观察结果。但是,不熟悉其数据集的此类系统的用户在尝试提取他们感兴趣的数据事件时面临一些挑战。这些挑战包括逐步发现信息图表,将它们组织成逻辑顺序以描述有意义的事实,以及安排一个或多个事实来说明数据事件。为了缓解这些问题,我们提出了 VisGuide——一个数据探索系统,它生成个性化的建议,通过逐步学习他们的数据探索偏好并推荐适合他们的有意义的图表来帮助用户发现数据事件的广度和深度。除了用户偏好,VisGuide 的建议同时考虑序列组织和图表呈现。我们进行了两项用户研究来评估 (1) VisGuide 的可用性和 (2) 用户对其推荐系统的满意度。这些研究的结果表明,VisGuide 可以有效地帮助用户创建表示有意义的数据事件的连贯且面向用户的可视化树。