视觉计算实验室在《Applied Soft Computing》上发表学术论文“DDU-Net: A dual dense U-structure network for medical image segmentation”

视觉计算实验室以第一作者(2021级博士研究生程俊龙)和通信作者(朱敏教授)于2022年7月27日在《Applied Soft Computing》期刊上在线发表学术论文“DDU-Net: A dual dense U-structure network for medical image segmentation”。该研究应对医学图像病灶尺度多样、结构边界模糊和模态众多的问题,设计了一种简单但性能良好的双向密集U型网络用于医学图像分割。该方法在皮肤病变、细胞核、肺、腺体和血管分割五种不同的医学图像分割数据集上取得了较好的实验结果,与最先进的分割方法相比在定性和定量评估方面都具有竞争力。

医学图像分割是将图像中的每个像素划分为相应类别的过程。它是医学图像分析中最重要的步骤之一。医学图像分割有助于从不同的组织、器官、病理学和生物结构中提取详细信息,用于医学诊断、手术规划和治疗[1, 2]。然而,在实践中分割通常由相关临床用户或病理学家手动执行,这既耗时又繁琐。随着医学图像数量和种类的增加,手动分割在成本和再现性方面变得不切实际[3]。因此,需要一种自动、准确、高效的医学图像分割方法。

图1. DDU-Net架构示意图

基于上述背景,该研究提出了一种具有双向U型结构的医学图像分割网络,具体工作包括:

1)构建了具有密集连接的双编码器,其中第一个编码器使用DenseNet作为固定特征提取器,其主干网络在ImageNet上预先训练,第二个编码器使用类似于第一个编码器的网络结构,两个编码器都试图对输入图像上的信息进行编码,每一层都以前馈方式直接连接到下一层。

2)设计了适用于双编码器结构的采样路径,并通过紧密连接的卷积层构建更深的解码器,融合两个编码器学习的从低到高级别的多尺度语义信息。

3)采用了一种结合边界和内容信息的多损失函数,使DDU-Net更加关注边界划分的准确性,以提高整体分割性能。

图2. SOTA方法训练过程中IoU值的变化曲线

综上所述,DDU-Net在U-Net[3]的基础上进行了改进,两个编码器和一个解码器结构能够从浅层和深层捕获更丰富的局部和全局信息。我们新设计的上采样路径更适合双编码器结构,不仅集成了低级到高级的语义特征,而且减少了全局信息的丢失。此外,与传统语义分割中常用的交叉熵、Dice和IoU损失相比,我们提出的边界+IoU损失更适合于噪声大、边界模糊的医学图像分割。

在未来的研究中,实验室还将进一步探索不同的技术和架构,以进一步提高模型的速度,减少参数数量,降低计算复杂度。此外,二分类模型过于简单,无法处理现实生活中更复杂的情况。之后将基于更复杂的情况(如多类别和多模态数据)构建具有强大鲁棒性和可迁移性的方法。

原文链接:https://www.sciencedirect.com/science/article/pii/S1568494622004860?dgcid=coauthor

参考文献:

[1] Xiaowei Xu, et al., Quantization of fully convolutional networks for accurate biomedical image segmentation, in: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, CVPR, 2018.

[2] Junlong Cheng, et al., Fully convolutional attention network for biomedical image segmentation, Artif. Intell. Med. 107 (2020) 101899.

[3] Olaf Ronneberger, Philipp Fischer, Thomas Brox, U-Net: Convolutional networks for biomedical image segmentation, in: International Conference on Medical Image Computing and Computer-Assisted Intervention, MICCAI, Springer, Cham, 2015.