2020年春季学期视觉计算实验室第一周论文研读预告

时间: 2020年03月05日 09: 00
地点: 四川大学视觉计算实验室钉钉群
研读成员: 明章强

研读内容:
[1]Ergys Ristani, Carlo Tomasi; Features for Multi-Target Multi-Camera Tracking and Re-Identification.[J].The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018, pp. 6036-6046.
[2]Zheng Tang, Milind Naphade, et al. CityFlow: A City-Scale Benchmark for Multi-Target Multi-Camera Vehicle Tracking and Re-Identification.[J].The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2019, pp. 8797-8806.
在本次论文研读中,讲者围绕川大重点研发项目具体需求,分享了两篇多摄像头多目标跟踪识别相关的文章。论文[1]的工作是杜克大学在多目标多摄像头跟踪(MTMCT)和行人重识别(Re-ID)基础上,提出新的权重损失函数和新的特征提取方法,并在新的数据集上测试MTMCT和Re-ID的功能;论文[2]主要介绍了NVIDIA新推出的CityFlow(流动的城市)数据集,是目前世界上第一个支持跨摄像头汽车跟踪及重识别的大型数据集,并分析了各种最先进算法在该数据集上的表现。

论文简介:
[1]MTMCT是在来自多个相机的视频中追踪多个行人,在人群分析,运动员姿势识别等领域均有非常广泛的应用,它比较的是分类性能。而Re-Id是从一个图片库里检索出与查询图片相似的任务,给出一个相似程度的排序,比较的是排列性能。在本文中,作者采用深度神经网络(CNN)为MTMCT&re-id的任务学习较好的特征,提出了一种自适应的三重损失方法和新的特征提取方法,并与传统方法比较,能够显著提高准确率和效率,无论是使用IDF1,MOTA或者rank1分数衡量在MTMCT和Re-ID上都达到最先进的表现。

Features

图1 采用DukeMTMC数据集的多摄像机多目标跟踪结果

[2]使用交通摄像头作为传感器的城市交通优化需要更强大的多目标跨摄像头跟踪支持。本文介绍的 CityFlow(流动的城市)数据集,是一个城市规模的交通摄像头数据集,该数据集包含超过20万个目标框,并且涵盖了多样的场景、视角、车辆模型和城市车流状况。本文还提供这个数据集的子集用作基于图像的车辆重识别,经过大量的实验分析,测试了各种各样的跨摄像头多目标跟踪、单摄像头多目标跟踪、目标检测和重识别的基准/最先进算法在该数据集上的表现,并分析了不同的网络结构、损失函数、时空模型以及它们的结合。

CityFlow

图2 多目标跨摄像头跟踪的三大组成部分:基于图片的重识别、单摄像头内的多目标跟踪以及摄像头之间的时空分析
123