当前位置: 首页 > news >正文

详细图解 Path-SAM2: Transfer SAM2 for digital pathology semantic segmentation

在这里插入图片描述

✨ 背景动机

  • 数字病理中的语义分割(semantic segmentation)是非常关键的,比如肿瘤检测、组织分类等。
  • SAM(Segment Anything Model)推动了通用分割的发展,但在病理图像上表现一般。
    病理图像(Pathology Images)指的是通过显微镜观察生物组织切片后拍摄的图像,主要用来帮助医生诊断疾病。
  • SAM2相较于SAM提升了准确率和泛化性,但在病理图像分割上,直接用SAM2还是不够好。
  • 因此,Path-SAM2提出了专门为病理图像设计的SAM2变体。

🛠 方法设计

整体架构如下:
在这里插入图片描述

主要包括:

  • SAM2图像编码器
  • 外部病理编码器UNI
  • 维度对齐模块
  • KAN分类模块(取代传统prompt)
  • 混合解码器

1. Pathology Encoder

  • SAM2自带的Hiera网络是为自然图像设计的,不够理解病理图像细节。
  • 新引入了UNI —— 一个在1亿张H&E病理图上自监督训练的超大模型,专门懂病理。
  • 做法:将SAM2编码器输出UNI编码器输出拼接(concat),作为后续特征输入。

2. KAN分类模块(取代Prompt)

  • 传统SAM需要人工给“点提示”(点在肿瘤位置提示模型),很麻烦。
  • 这里引入了Kolmogorov–Arnold Network(KAN),代替人工prompt,自动生成分类提示。
  • KAN的特点:用可学习的单变量函数,取代传统MLP的线性权重,提升了参数利用率和解释性。

3. Loss设计

  • 总损失 = **Dice Loss + Focal Loss + IOU Loss(MSE)**的加权组合。
  • 参数 α 和 β 控制各部分的比重(文中默认α=0.125,β=0.01)。

📊 实验与结果

数据集

  • EBHI:4,456张 224×224 的切片
  • CRAG:213张 1536×1536 的大图
  • GlaS:165张 522×775 的肠腺癌组织

实验设置

  • 使用SAM2UNI的预训练权重
  • 三层KAN网络
  • 优化器:AdamW
  • 训练硬件:4× RTX V100 GPU

主要结果(见表格)

方法EBHI IOUCRAG IOUGlaS IOU
Fine-tuned SAM250.24%53.17%47.82%
MedSAM2 (pp)62.29%49.72%48.55%
Path-SAM2 (Ours)93.17%89.38%92.02%
  • ➡️ Path-SAM2在三个病理数据集上都大幅领先其他方法。
  • ➡️ 引入UNI病理知识+KAN分类模块的改动起了决定性作用。
  • ➡️ 相比SAM/SAM2,即便人工精细点prompt,Path-SAM2仍明显更好。

Ablation Study(消融实验)

  • 证明了KAN模块比传统MLP更好,带来了显著的IOU提升。

🏁 结论

  • Path-SAM2是首个基于SAM2,且针对病理图像语义分割特别设计的模型。
  • 核心贡献:
    • 结合了UNI病理编码器增强病理领域知识。
    • KAN分类器代替人工prompt,提升了自动化和精度。
  • 在多个病理数据集上验证了出色性能,未来会公开代码和模型权重。

相关文章:

  • 计算机网络-运输层(1)
  • 2025.4.27_C_Struct,Enum,Union
  • 如何通过OKR管理项目目标
  • 【第三十三周】BLIP论文阅读笔记
  • Flink02-学习-套接字分词
  • Ldap高效数据同步- MirrorMode双主复制模式配置详解(上)
  • 在 Cursor 中 配置 GitHub MCP Server
  • AI 应用同质化:一场看不见的资源 “吞噬战”
  • 软考:软件设计师考试数据结构知识点详解
  • HTML5 新特性详解:语义化标签、表单与音视频嵌入
  • 底层源码和具体测试解析HotSpot JVM的notify唤醒有序性(5000字详解)
  • JimuBI 积木报表 v1.9.5发布,大屏和仪表盘,免费数据可视化
  • 当AI浏览器和AI搜索替代掉传统搜索份额时,老牌的搜索引擎市场何去何从。
  • ubuntu 日志文件清空方式的解读
  • Ubuntu22.04/24.04 P104-100 安装驱动和 CUDA Toolkit
  • FFmpeg之三 录制音频并保存, API编解码从理论到实战
  • C++初阶-STL简介
  • Unity 和 Unreal Engine(UE) 两大主流游戏引擎的核心使用方法
  • 司法大模型构建指南
  • 模方ModelFun工程操作教程
  • 庆祝中华全国总工会成立100周年暨全国劳动模范和先进工作者表彰大会隆重举行,习近平发表重要讲话
  • 澎湃思想周报丨数字时代的育儿;凛冬已至好莱坞
  • 四川落马厅官周海琦受审,1000多人接受警示教育
  • 中国人民对外友好协会代表团访问美国
  • 弘扬 “上海精神”,上合组织政党论坛聚焦政党责任与使命
  • 龚曙光:散文家永远只有一个视角,就是“我与时代”