2020年秋季学期视觉计算实验室第十六周论文研读预告

时间: 2021年01月14日(本周四) 09 : 00
地点: 望江校区基础教学楼B座318实验室
研读成员: 明章强

分享者: 明章强
分享内容:
[1]Luo H, Gu Y, Liao X, et al. Bag of tricks and a strong baseline for deep person re-identification[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops. 2019: 1487-1495.
[2]Luo H, Jiang W, Zhang X, et al. AlignedReID++: Dynamically matching local information for person re-identification[J]. Pattern Recognition, 2019, 94: 53-61.
[3]Zhang X, Luo H, Fan X, et al. Alignedreid: Surpassing human-level performance in person re-identification[J]. arXiv preprint arXiv:1711.08184, 2017.

论文简介:
[1]近年来,具有深度神经网络的人员重新识别(Re-ID)取得了进展并取得了高性能。但是,许多最新的方法都设计了复杂的网络结构并连接了多分支特征。为了进行比较,本文归纳在ECCV2018和CVPR2018上发表的文章。大多数以前的工作都是在较差的基准上进行的。有些作品与其他最新方法相比不公平,改进往往来自训练技巧,而不是方法本身。本文将归纳和评估目前有效的Re-ID训练技巧,包括预热学习率(Warmup)、随机擦除数据增强(REA)、标签平滑(LS)、批次归一化Neck(BNNeck)和中心损失(Center Loss)。通过将这些技巧结合在一起,并设计一个强大的行人重识别基线(Re-ID Baseline),该模型仅使用全局特征即可在Market1501上实现94.5%的rank-1和85.9%的mAP。

---Re-ID---------

图1 强大的Re-ID基线模型流程示意图
[2]在计算机视觉中,行人重识别依然是一项具有挑战性的任务。一方面:先前的大多数工作都集中在使用卷积神经网络(CNN)学习一个人的全局特征上,通过简单的分类损失或深度度量学习损失以进行训练,但这些基于全局特征的方法很难解决包括姿态变化、光照变化和遮挡等问题。另一方面:为了学习更好的局部特征,一些研究者引入 人体姿势估计模型,用于获取人体姿势点,匹配不同的人体部位或对齐视点。但训练人体姿势估计模型需要额外标记数据,获取人体姿势点需要更多的GPU资源。

为此,本文提出了一种新颖的Re-ID框架,称为AlignedReID ++,该框架包含一个局部特征学习分支和全局特征学习分支,其中局部分支可以指导全局分支学习更多有区别的全局特征。并提出一种称为动态匹配本地信息(DMLI) 的新方法,该方法可以动态对齐水平条纹,而无需额外的监督或显式的姿态估计。所提出的方法可以轻松地应用于几乎所有基于CNN的人员Re-ID框架。在某种程度上,DMLI可以解决由于错误的行人检测框,变化的视角,遮挡等导致的人体姿势变化。

-------------

图2 动态匹配局部信息(DMLI)示意图
123