当前位置: 首页 > news >正文

处理图像的深度神经网络(DNN)有哪些呢?

我按应用领域经典结构类别来总结一下:


✅ 一、图像处理常见任务

任务类型所用网络
图像分类CNN、ResNet、VGG、DenseNet、EfficientNet
目标检测R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD、RetinaNet
图像分割U-Net、FCN、DeepLab系列、SegNet、Mask R-CNN
图像生成GAN、DCGAN、Pix2Pix、CycleGAN、StyleGAN
超分辨率SRCNN、ESPCN、EDSR、SRGAN
图像风格迁移VGG-based Style Transfer、AdaIN、CycleGAN
图像重建/去噪DnCNN、UNet、RED-Net、AutoEncoder
特征提取/对比学习SimCLR、MoCo、BYOL、ResNet变体

✅ 二、按模型结构分类

1. 卷积神经网络(CNN类)
  • LeNet-5:最早用于手写数字识别。
  • AlexNet:2012年ImageNet冠军,开启深度CNN时代。
  • VGG16 / VGG19:结构简单但层数深,卷积核固定为3×3。
  • GoogLeNet (Inception):使用不同大小卷积核组合,提升特征提取能力。
  • ResNet:引入残差结构(skip connection),解决深层网络退化问题。
  • DenseNet:每层连接所有前面层的输出,增强特征传播。
  • EfficientNet:通过复合缩放策略提高效率和精度。
2. Transformer结构(Vision Transformer类)
  • ViT (Vision Transformer):将图像划分为patch,再输入Transformer。
  • Swin Transformer:采用局部窗口注意力和层次结构,兼顾精度和效率。
  • DeiT:数据高效版ViT,适合小数据训练。
3. 混合结构
  • ConvNeXt:融合CNN与Transformer优点的结构。
  • CoaT、T2T-ViT、MobileViT:针对小模型场景优化的混合架构。

✅ 三、生成与对抗模型(用于图像生成、重建)

  • AutoEncoder / Variational AutoEncoder (VAE)
  • GAN(生成对抗网络)
    • DCGAN:最基本的生成式网络
    • Pix2Pix / CycleGAN:用于图像翻译、风格迁移
    • StyleGAN / StyleGAN2:用于超清图像生成、人脸合成

✅ 四、语义分割网络(像素级任务)

  • FCN(Fully Convolutional Network)
  • U-Net / U-Net++
  • DeepLabV3 / V3+
  • Mask R-CNN:目标检测+分割二合一

相关文章:

  • MCP服务端开发
  • Thymeleaf简介
  • 基于单片机的温湿度采集系统(论文+源码)
  • uniapp打包报错,
  • 第12篇:Linux程序访问控制FPGA端Switch<一>
  • 习题2.8 输出全排列
  • linux ptrace 图文详解(六) gdb单步调试
  • OJ笔试强训_1至24天
  • PHP腾讯云人脸核身获取SIGN Ticket
  • 强化学习算法系列(六):应用最广泛的算法——PPO算法
  • vcpkg缓存问题研究
  • [Redis]1-高效的数据结构P2-Set
  • C++获取程序的所有用到的库
  • Flash存储器(二):SPI NAND Flash与SPI NOR Flash
  • 2025-04-19 Python 强类型编程
  • GEO优化之企业客服知识库搭建全流程实例(医疗健康行业)
  • Kafka系列之:计算kafka集群topic占的存储大小
  • Kafka安全认证技术:SASL/SCRAM-ACL方案详解
  • 【KWDB 创作者计划】_算法篇---Stockwell变换
  • Kubernetes Pod 调度策略:从基础到进阶
  • 东航推出“上博号”班机,上博设立“东航特展厅”
  • 复旦大学空间互联网研究院成立,将聚焦卫星互联网等领域
  • 奥利弗·沙赫特博士:集群是产业集聚地,更是“超级连接器”
  • 李公明︱一周书记:时代风雨中的……叛逆者在前行中
  • 助力外贸外资企业高质量发展,上海市区两级领导密集调研、召开座谈会
  • 上海专家绘制迄今为止分辨率最高的“野生稻-栽培稻泛基因组图谱”