SAM-Med2D的个人理解 – -TobyKSKGD的个人博客-

【SAM-Med2D】

本篇文章是个人看文献的一些总结和个人的想法，都是个人看过文章之后的理解，不保证一定是对的，如果我的理解有错，欢迎纠正。

（2023.8.30）

医学图像分割有助于医生准确诊断和治疗。

现有的方法通常受限于特定模态、器官或病变，难以广泛应用于不同的临床场景。

SAM是一个在自然图像分割上表现出色的模型，但在医学图像上直接应用效果不佳，原因在于自然图像与医学图像之间的领域差异。

本文收集并整理了约4.6M图像和19.7M掩码，构成了一个大规模的多模态、多对象的医学图像分割数据集。

数据预处理方面，对3D数据集进行了标准化处理，提取了所有切片图像及其对应的掩码，并进行了适当的筛选以保证图像质量。对于2D数据集，进行了像素值范围的检查，并保存为PNG格式。

对于包含多个类别的掩码，生成多个单一类别的掩码，并将包含多个连通组件的掩码分割成单个连通组件的掩码，以增加数据多样性。

本文收集的数据集来源和组成部分：

本文对SAM进行了全面的微调，包括边界框、点提示、掩码提示，以适应医学图像分割的多样化需求。

本文使用9个MICCAI2023数据集来评估SAM-Med2D的泛化能力，以确保其在未知医学图像环境下的准确分割。

SAM-Med2D的模型框架如下：

在微调过程中，冻结了原始图像编码器的所有参数，并在每个Transformer块中添加了适配器层。可以在不增加计算成本的情况下将医学领域知识整合进图像编码器。

使用点、框和掩码信息对提示编码器进行微调，以增强其在医学成像领域的适用性。同时通过交互训练更新掩码解码器的参数。

SAM-Med2D的评估：

使用SAM作为baseline模型，选择Bbox和Points两种直观的提示模式来评估SAM-Med2D的性能。

在10种不同的医学图像模态上评估SAM-Med2D的性能。

在不同的解剖结构和31个主要器官上进行评估，以深入了解SAM-Med2D在不同场景中的性能差异。

在9个MICCAI 2023数据集上测试SAM-Med2D，以验证其在新的医学图像数据上的泛化能力。

实验部分：

通过测试集上的实验结果，比较了SAM、仅微调掩码解码器的FT-SAM和SAM-Med2D的性能。SAM-Med2D在边界框提示模式下相比SAM取得了显著的性能提升。

评估了SAM-Med2D对于不同成像模态的性能，结果是SAM-Med2D在所有成像模态上均显著优于SAM。

在9个公开数据集上测试了SAM-Med2D的泛化能力，结果表明SAM-Med2D在两种提示模式下都展现出了更好的泛化性能。

定性比较通过视觉比较直接观察SAM和SAM-Med2D生成的分割掩码，展示了两种方法在不同模态和解剖结构上的表现。SAM-Med2D在边界定位上更清晰，更接近真实标注。SAM在定位目标区域上存在困难，而SAM-Med2D即使在单点交互下也能生成更准确的分割结果。

发送评论 编辑评论