当前位置: 首页 > news >正文

The backpropagation and the brain

这篇文章探讨了反向传播算法(Backpropagation)与大脑学习机制之间的潜在联系,提出了一个名为“神经梯度通过活动差异表示”(NGRAD)的框架,以解释大脑如何在多层神经网络中实现高效的信用分配(credit assignment)。以下是主要内容、创新点和原理的总结:

 

主要内容

  1. 反向传播的生物学挑战
    反向传播通过链式法则计算梯度并反向传递误差信号,是人工深度网络的核心算法,但其生物学合理性长期受质疑,原因包括:

    • 权重对称性:传统反向传播要求前向与反馈连接的权重严格对称,但大脑中缺乏这种精确对称的证据。

    • 误差信号传递:大脑的反馈连接主要用于调节神经活动(如注意力、预测),而非显式传输误差信号。

    • 局部可塑性规则:生物突触的修改通常依赖局部信息(如突触前后神经元的活性),而非全局误差。

  2. NGRAD框架的核心思想
    作者提出,大脑可能通过反馈连接诱导神经活动的差异(而非直接传输误差信号)来近似反向传播的梯度。这种差异可通过以下方式生成:

    • 目标传播(Target Propagation):利用自编码器(auto-encoder)结构,通过反馈连接将输出目标反向映射到隐藏层,生成局部活动差异。

    • 分阶段活动比较:通过比较前向传播的基线活动与反馈驱动的目标活动,计算局部误差(如GeneRec、平衡传播算法)。

    • 树突分区计算:利用神经元的空间分区(如基底树突与顶端树突)分别处理前向输入和反馈信号,通过跨区互动调整突触权重。

  3. 生物学证据与支持

    • 反馈对齐(Feedback Alignment):实验表明,即使反馈权重是随机的,前向权重会逐渐对齐反馈路径,使网络仍能高效学习。

    • 皮层结构与功能:大脑的分层组织、反馈连接的普遍性(如视觉皮层V1与V2间的循环连接)与反向传播的架构相似。

    • 神经活动的匹配:反向传播训练的网络在视觉和听觉任务中的表征与灵长类大脑神经活动高度相似,提示类似机制可能存在于生物系统中。


创新点

  1. 突破传统反向传播的生物学限制
    提出NGRAD框架,利用局部活动差异而非全局误差传播,绕过对称权重和显式误差信号传递的生物学不现实性。

  2. 反馈对齐机制
    证明随机反馈权重可通过前向权重的自适应调整实现有效学习,为大脑中非对称反馈连接的学习机制提供理论支持。

  3. 目标传播与树突计算
    结合自编码器和树突功能分区(如基底树突处理前向输入、顶端树突接收反馈),提出多层网络通过局部误差调整权重的生物学可行方案。

  4. 统一多种学习算法
    将对比赫布学习(Contrastive Hebbian Learning)、平衡传播(Equilibrium Propagation)等算法纳入NGRAD框架,表明它们在近似反向传播梯度上的共性。


原理

  1. 局部误差计算
    通过比较前向传播的活动与反馈诱导的目标活动(如目标传播中的重构误差),生成局部梯度信号,替代传统的链式法则计算。

  2. 分阶段或分区处理

    • 时间分阶段:如GeneRec通过“负相位”(基线活动)和“正相位”(目标驱动活动)的差异调整权重。

    • 空间分区域:利用树突的电子隔离特性(如顶端树突接收反馈、基底树突处理输入),实现前向与反馈信号的分区处理与整合。

  3. 突触可塑性的调制
    反馈信号通过调节神经元活动(如增益控制、树突平台电位)影响突触的可塑性规则,使局部权重更新与全局目标一致。


总结

        本文的核心贡献在于将反向传播的数学原理与生物神经机制相结合,提出了一种通过局部活动差异和反馈调制实现高效信用分配的框架(NGRAD)。这一理论不仅为理解大脑学习提供了新视角,也为设计更生物启发的机器学习算法开辟了道路。尽管具体实现细节仍需进一步实验验证,但其核心思想——利用反馈诱导的活动差异近似梯度——为神经科学与人工智能的交叉研究提供了重要桥梁。

相关文章:

  • Java—— 正则表达式 练习
  • crictl 拉取镜像报错 Unimplemented desc = unknown service runtime.v1.ImageService
  • Java基础系列-HashMap源码解析1-BST树
  • Adobe After Effects的插件--------Optical Flares之Lens Objects参数
  • 【计算机视觉】CV项目实战- Florence-SAM 多模态视觉目标检测+图像分割
  • 12、高阶组件:魔法增幅器——React 19 HOC模式
  • [java八股文][Java基础面试篇]设计模式
  • 视频智能分析平台EasyCVR无线监控:全流程安装指南与功能应用解析
  • 单例模式:确保唯一实例的设计模式
  • Chrome/Edge浏览器使用多屏完美解决方案,http部署使用https部署的功能
  • 【Tools】Git常见操作
  • arm64适配系列文章-第一章-arm64环境上kubesphere和k8s的部署
  • 安裝nginx1.26.3
  • 【MCP】第二篇:IDE革命——用MCP构建下一代智能工具链
  • OCR之身份证识别
  • 第十五届蓝桥杯 2024 C/C++组 艺术与篮球
  • 批量将多个 Excel 表格中的某张图片替换为新的图片
  • 《解锁vLLM:大语言模型推理的加速密码》
  • 大语言模型的“模型量化”详解 - 01:原理、方法、依赖配置
  • python基础语法测试
  • 叶迪奇任陆金所控股董事长,赵容奭继续担任CEO
  • 网培机构围猎中老年人:低价引流卖高价课、“名师”无资质,舆论呼吁加强监管
  • 外交部:制裁在涉港问题上表现恶劣的美方人士是对等反制
  • 河南省濮阳市委常委、组织部部长刘建茂接受审查和调查
  • 罗马教皇方济各去世,享年88岁
  • 青海玉树州杂多县发生4.6级地震,震源深度10千米